Med talegjenkjenning kan du skrive med stemmen

DOI

Skriving kan være vanskelig, og det er noe mange sliter med. Men man trenger ikke nødvendigvis å skrive ved å bruke tastatur eller penn.

Med diktering, transkribering eller talegjenkjenning kan man skrive med stemmen1Diktering brukes her synonymt med talegjenkjenning og transkribering som Wikipedia definerer slik: «talegjenkjenning er gjenkjenning av menneskelig tale ved hjelp av en maskin.». Jeg vill i dette innlegget omtale diktering, samt komme med noen tips og råd til hvordan man kan ta i bruk, og effektivt nytte talegjenkjenning som et verktøy til å skrive gode tekster.

I dag er diktering tilgjengelig på de fleste plattformer. Microsoft har innebygd diktering i Windows 10 og 11, samt i Microsoft 365 (Word, OneNote, Outlook osv.), Google har innebygd diktering i Android, Chromebook, Google dokumenter, Google presentasjoner2Google presentasjoner støtter kun stemmestyrt skriving av foredragsnotater., Gmail osv.3Google bruker betegnelsen «stemmestyrt skriving» om det som Microsoft og Apple kaller diktering og er kun tilgjengelig i nettleseren Chrome., og Apple har diktering på iPhone, iPad og Mac.

Jeg bruker selv flittig diktering i Windows 11 og Microsoft 365. Kvaliteten på dikteringen er generelt meget god, og med litt trening så er det veldig lett å få god kvalitet på teksten. Det er dog viktig å poengtere at en maskin aldri vil være like god på å tyde tale som oss mennesker, så det fletter seg selvsagt inn feil fra tid til annen.

Selv har jeg lite erfaring med diktering i Googles produkter, men opplever at kvaliteten på talegjenkjenningen i Android er langt dårligere enn i Microsofts tjenester. Den gang jeg for en del år siden hadde iPad brukte jeg dikterings funksjonen fra tid til annen, men i og med at det er flere år siden sist jeg brukte Apples talegjenkjenning vil mine erfaringer antagelig ikke lenger være representativ for løsningen i dag .

Hva trengs for å diktere?

Microsoft Moderne hodesett og Olympus RecMic II RM-4010P.

I utgangspunktet trenger man ikke annet enn en enhet med mikrofon for å diktere, men man får mye mer nøyaktige resultater og man har en god mikrofon. Av egen erfaring kan jeg si at en god mikrofon er viktig for effektiv og nøyaktig diktering. Selv bruker jeg en Olympus RecMic II RM-4010P som er en kablet spesialmikrofon spesielt utviklet for diktering. Denne spesialmikrofonen koster 2.500,- hos Dikteringsbutikken.

Man trenger virkelig ikke en slik spesialmikrofon. For de fleste vil mikrofonen på et vanlig hodesett som Microsoft Moderne hodesett beregnet på nettmøter være mer en bra nok.

Og da er det faktisk ikke noe mer man trenger. Det meste som finnes av utstyr utenom mikrofon, er beregnet på avanserte storbrukere som leger og andre som aktivt bruker diktering i jobben.

Tips og triks

Som jeg skrev tidligere i teksten er det ganske så enkelt å bruke diktering når man har fått litt trening. Når man dikterer er det viktig at man prøver å snakke på den mest mulig skriftlig måte. For det er stor forskjell på måten vi snakker, og måten vi skriver. Det er selvsagt langt viktigere at du får skrevet ned det du ønsker en av teksten har en skriftlig og ikke muntlig oppbygging. Eksempelvis vil det ved skriving av klage være viktigere at klagen blir skrevet enn at teksten ville imponert norsklæreren du hadde på skolen.

Øv på diktering

Selv om det ikke er vanskelig å skrive ved hjelp av diktering er det tilfellet at øvelse gjør mester. I starten kan det føles rart å skrive med stemmen, spesielt om man er nøye med å snakke på en skriftlig måte. Videre går det gjerne tregt i starten. Man er ikke vandt med å snakke skriftlig, uttale tegnsetting, linjeskift og andre kommandoer man normalt har gitt ved å trykke på et tastatur.

Du må derfor ikke miste motet om du i starten skriver tregere med diktering en du gjør på et tastatur. De fleste som leser dette har flere års erfaring med bruk av tastatur for skriving, noe de fleste ikke har med diktering. Heldig vis har de fleste av oss også mange års erfaring med å snakke, men det gjør dessverre også at vi har mange år med muntlig tale å venne oss av med slik at vi får et godt skriftlig resultat. Å lære seg en skriftlig talemåte vil antagelig være den største utfordringen for brorparten av de som tar i bruk talegjenkjenning, men det er heldig vis en utfordring som ikke er altfor vanskelig og overkomme.

Derfor anbefaler jeg på det sterkeste at man øver litt i starten. Det er mange måter man kan øve på, for eksempel kan man svare på e-poster, skrive notater, eller opprette et Word eller Google dokument på enheten hvor man dikterer ned noen avsnitt. Det behøver ikke å være noe større mening i det, eller stor sammenheng, men det er kun gjennom øvelse at man lærer hvordan å diktere godt.

Man kan også øve på diktering når man skriver SMS-er eller ved å bruke lydopptaker på telefonen. Et lydopptak kan brukes i ettertid for å forstå hvordan man snakker og hvilke feil man gjør, noe som kan være til hjelp i eget forbedringsarbeid.

Da en tale skal skrives for øret, vil det å skrive fiktive taler kunne være en god måte å gjøre seg komfortabel med å skrive med stemmen heller en med tastatur. Jeg kommer inn på å skrive taler med diktering lenger ned i innlegget.

Nøling

Nøling eller fyllyder som «…eh…» bør man prøve å unngå. Det er spesielt viktig om man bruker lydopptaker for senere å skulle transkribere opptaket. Det gjelder uavhengig av om man transkriberer med talegjenkjenning eller manuelt. Mer om transkribering av lydopptak lenger ned.

Problemet med fyllyder som «eh» er ikke at de blir skrevet, men at de fort kan blande seg inn i andre tilstøtende ord og dermed gjør at talegjenkjenningsprogramvare mistolker det som blir sagt. Det behøver ikke å være et stort problem, men om man skriver lengre tekster vil det kunne medføre ekstra arbeid i reinskrivingsfasen.

Slå av automatisk tegnsetting

Jeg anbefaler videre at man i Windows og Microsoft 365 slår av funksjonene «automatisk tegnsetting» og «filtrer sensitive uttrykk» da ingen av disse vil bidra noe positivt til dikteringen. Automatisk tegnsetting har en lei tendens til å sette inn komma og punktum i utide (men ikke i tide), noe som gir en tekst av svært lav kvalitet.

Det er langt bedre å bruke å bruke talekommandoer hvor man sier ‘komma’, ‘punktum’, ‘utropstegn’, ‘emneknagg’ osv. (oversikt over talekommandoer i Microsofts produkter finner du lenger ned).

Dikter i stille omgivelser

En av de største svakhetene med talegjenkjenning er at bakgrunnsstøy drastisk reduserer nøyaktigheten. Det er derfor viktig å diktere i omgivelser med lite støy for at skrivingen skal bli mest mulig effektiv og at færrest mulig feil kommer med i teksten.

Spesialmikrofoner som Olympus RecMic II RM-4010P er laget for å fungere bedre i noe mere støyete omgivelser, men selv med slike mikrofoner vil bakgrunnsstøy ha en markant negativ effekt.

Som en kan se av bilde til høyre er det mulig å endre RecMics mikrofonkarakteristikk til å være mer retningsbestemt, slik at mindre støy blir fanget opp. En ulempe med kraftig retningsbestemthet er at man må være veldig nøye med hvordan man holder mikrofonen. Om den blir holdt litt skjeft fanger den kanskje ikke opp stemmen din.

Altså, prøv å finne et rolig sted når du skal diktere, slik at du får en best mulig opplevelse.

Bruk diktering til førsteutkast

Innstilling for støynivå.

Det kan være krevende å skrive et ferdig dokument kun med diktering. Ofte vil det enkleste være å bruke diktering til å skrive førsteutkastet eller til de grove trekkene i dokumentet for deretter å gjennomarbeide dokumentet på mer tradisjonell måte. Man kan selvsagt med en del trening klare og diktere et mer eller mindre ferdig dokument, men spesielt i starten vil det ikke være realistisk å forvente at man får det til.

Talegjenkjenning er ikke noe magisk vidunderprodukt som løser alle problemer, men vil om man bruker det riktig gi økt effektivitet og forenkle skriving. Som med alle andre produkter er diktering kun så effektivt som det brukeren er. Med det mener jeg at det er viktig å være bevisst på måten man snakker og på bruk av talekommandoer for tegnsetting.

Skriv talen med diktering

I motsetning til i skriftlig arbeid må taler skrives for øret. Diktering er dermed et glimrende verktøy for å få ned talen på den måten den skal leses. For i motsetning til det jeg har skrevet under overskriften «Øv på diktering» om at man må øve på å snakke på en skriftlig måte vil det være naturlig å skrive en tale på en muntlig måte. Om jeg ikke husker feil var det når jeg skulle skrive min første tale at jeg for første gang tok i bruk diktering. For jeg har vanskelig for å skrive muntlig. Jeg har en tendens til å skrive på en formell måte, noe som ikke egner seg til en muntlig tale.

Bruk nøkkelord

Du vil kunne oppleve at talegjenkjenningsprogramvaren kan ha problemer med å forstå enkelte ord og navn. I slike tilfeller vil man kunne bruke nøkkelord istedenfor ordet eller navnene som ikke blir gjenkjent og i reinskrivingsfasen bruke funksjonen søk og erstatt i Word til å erstatte nøkkelordet med navnet.

Transkriber lydopptak

Å gjøre lydopptak av møter man deltar i kan være et godt verktøy for å sikre at vi autister får med oss det som er viktig. Videre er lydopptak god dokumentasjon å ha om man skulle komme i en situasjon hvor det er ord mot ord. Når jeg gikk over fra sykepenger til AAP fikk jeg beskjed av veilederen på Nav om at det ikke var noe jeg skulle foreta meg før hun sa ifra. Når da meldekort ikke ble sendt var lydopptak fra møtet spesielt viktig å ha. For da kunne jeg dokumentere at Nav hadde gjort feil slik at de måtte betale AAP for tiden jeg ikke hadde sendt meldekort.

Vi har tidligere publisert en artikkelsamling som taper seg lovligheten av skjult lydopptak. Denne artikkelen finner du her Skjult lydopptak. Kort fortalt har du som privatperson lov til å ta opp enhver samtale der du selv er med. Da det i Norge er fri bevisførsel i retten vil et lydopptak som er gjort uten informasjon eller samtykke kunne føres som bevis ved en eventuell rettssak.

Et problem med lydopptak er at det er vanskelig å finne tilbake igjen til det spesifikke tidspunktet hvor noe ble sagt. For å øke verdien av dokumentasjonen bør lydopptakene transkriberes, noe som kan gjøres i Word og OneNote. Du finner en veiledning for hvordan transkribere i Word her.

Ressurser

Talekommandoer Microsoft

Talekomandoene under er hentet i sin helhet fra Microsofts kundestøtteside Bruke taleskriving til å snakke i stedet for å skrive på PC-en.

Kommandoer for taleskriving

Bruk taleskrivingskommandoer til raskt å redigere tekst ved å si ting som «slett det» eller «velg det».

Listen nedenfor forteller deg hva du kan si.

Kommandoen TaleskrivingHva du kan si
Stopp eller stans taleskriving midlertidigSett taleskriving på pause
Sett diktering på pause
Stopp taleskriving
Stopp diktering
Stopp lytting
Stopp diktering
Stopp talemodus
Sett talemodus på pause
Slette siste talte ord eller uttrykkSlett det Slett det Stryk det  
Merke siste talte ord eller uttrykkVelg det

Tegnsettingskommandoer

Bruk taleskrivekommandoer til å sette inn skilletegn.

Listen nedenfor forteller deg hva du kan si.

Hvis du vil sette inn detteSi dette
avsluttende enkelt anførselstegn
venstre enkelt anførselstegn
høyre enkelt anførselstegn
begynnende enkelt anførselstegn
minustegn
bindestrek
kort tankestrek
tankestrek
!utropstegn
#emneknagg
nummertegn
$dollartegn
%prosenttegn
&og-tegn
(venstreparentes
)høyreparentes
,komma
.punktum
/skråstrek
:kolon
🙁rynkefjes
🙂smilefjes
;semikolon
😉blinkefjes
?spørsmålstegn
@alfakrøll omtale
krøllalfategn
[venstre hakeparentes
\nny linje
nytt avsnitt
]høyre hakeparentes
apostrof
begynnende anførselstegn
venstre anførselstegn
avsluttende anførselstegn
høyre anførselstegn
£britisk pund-tegn
¥yen-tegn
eurotegn
+plusstegn
<mindre enn-tegn
<3hjerte-emoji
=likhetstegn
>større enn-tegn
±pluss- eller minustegn
×multiplikasjonstegn
÷divisjonstegn
°gradetegn
‘sapostrof s
apostrof-ess

Noter

  • 1
    Diktering brukes her synonymt med talegjenkjenning og transkribering som Wikipedia definerer slik: «talegjenkjenning er gjenkjenning av menneskelig tale ved hjelp av en maskin.»
  • 2
    Google presentasjoner støtter kun stemmestyrt skriving av foredragsnotater.
  • 3
    Google bruker betegnelsen «stemmestyrt skriving» om det som Microsoft og Apple kaller diktering og er kun tilgjengelig i nettleseren Chrome.

Oppdag mer fra Autismepodden

Abonner for å få de siste innleggene sendt til din e-post.


Legg inn en kommentar

Dette nettstedet bruker Akismet for å redusere spam. Lær om hvordan dine kommentar-data prosesseres.

Om autismepodden

Autismepodden er Norges første podcast om autisme. Vårt mål er å formidle faglig korrekt informasjon uten å miste autistenes stemme – For hvem er vel egentlig de virkelige autismeekspertene?

Kategorier

Denne nettsiden bruker informasjonskapsler (cookies). Ved å fortsette å bruke nettstedet aksepterer du dette.  Les mer

Du er offline. Koble til internett for å laste nytt innhold!