Visar inlägg med etikett text. Visa alla inlägg
Visar inlägg med etikett text. Visa alla inlägg

torsdag 11 juli 2013

OCR i iPhone

Jag testade nyligen två gratisappar för textigenkänning i min telefon. Image to Text är helt gratis. Bara att fota eller välja ett foto och sedan "Dela" - preview-knappen gör ingenting på min telefon åtminstone. Det påstods att det ska gå att spara också direkt i Evernote, men det alternativet erbjöds inte mig, utan den extraherade texten och fotot skickas per e-post. Appen förstod också att bilden var fel vänd. Problemet var att skandinaver var obekanta ...


Så här blev texten, rätt hyfsad tycker jag med tanke på bildens dåliga kvalitet:

Traditionellt anses ar-
kiv innehalla unika dokument; bibliotek daremot dokumentko-
pior. Digitaltekniken utplanar denna skillnad mellan arkiv och
bibliotek. Hadanefter kan varje bibliotek innehalla varje arkiv,
och vice versa, savida inte Google Inc. lyckas lagga beslag pa
hela kakan.
Internet ar lika granslost som biblioteket, om vi bara vill ha det sa.
En dag, nar jag tittade pa nagra gamla filer fran forra artusen-
det, snavade jag over foljande reflexioner:
"Om nagon i fromtiden avgiftsfritt fran biblioteket skulle kunna
hamta en elektronisk kopia av en bok, Milken det an vara mande,
varfor skulle ban nagonsin sdtta sin fot i en bokhandel igen?

Den andra appen, Mobile OCR, använder sig av en freemium-businessmodell, dvs man kan avläsa fem texter om dagen utan att betala. Antalet ska antagligen nollas via Applestore, men det fick jag inte att fungera. Att köpa 30 avläsningar kostar 99 amerikanska cent och obegränsat antal $ 2.99 Appen känns logiskt nog mer färdig än föregående och har ordlistor på fler språk inkluderade, vilket omedelbart syntes i resultatet. Men den kunde inte läsa den felvända texten överhuvudtaget, protesterade inte ens, utan mejlade mig en massa smörja - och brände en credit på det! Då jag vände bilden rätt blev resultatet riktigt bra:

Traditionellt anses ar-
016,13 hålla unika dokument; bibliotek däremot dokumentko-
^^JLjtaltekniken utplånar denna skillnad mellan arkiv och
PbJiotek. Hädanefter kan varje bibliotek innehålla varje arkiv,
och vice versa, såvida inte Google Inc. lyckas lägga beslag på
hela kakan.
Internet är lika gränslöst som biblioteket, om vi bara vill ha det så.
En dag, när jag tittade på några gamla filer från förra årtusen-
det, snävade jag över följande reflexioner:
"Om någon i framtiden avgiftsfritt från biblioteket skulle kunna
hämta en elektronisk kopia av en bok, vilken det än vara månde,
varför skulle han någonsin sätta sin fot i en bokhandel igen?
Om resultatet är så här bra kan det vara lönt att köpa appen (freemium är en bra modell), men knaggligheten med att nolla räknaren ger å andra sidan en lite opålitlig bild av appen. Vågar man? Som plus kan nämnas "Copy to clipboard"-funktionen.

På det hela taget kan man bara glädjas över den nya tekniken. Att avläsningstekniken ännu skulle utvecklas till att klara av handskriven text, skulle vara fantastiskt. Hoppas det finns efterfrågan!

Textsnutten kommer förstås från Mikael Bööks essä om bibliotekens framtid, publicerad i Nya Argus  och i den högst läsvärda essäsamlingen Biblioteksaktivisten - rekommenderad läsning för alla i branschen eller med intresse för samhällsutvecklingen.




lördag 9 februari 2013

Skriva, studentskrivningar

Råkade höra delar av en rätt intressant diskussion i radio (på finska) om studentskrivningarna och utvecklandet av dem. Man diskuterade, givetvis, om man borde ta i bruk datorer under proven. Diskussionsdeltagarna var överens om att det är en alldeles annan sak att producera text för hand.  Är det en färdighet studenterna behöver ha i dagens värld? Är det så att man borde övergå helt från det ena till det andra, eller borde man se till att träna upp båda? En sak de inte egentligen tog upp  var att man vid åtminstone Helsingfors Universitet vad jag vet inte i normala fall skriver tenter på dator. Så åtminstone med tanke på vissa studier behövs färdigheten att komponera handskrivna längre texter.

Om den digitala texten och produktion av den kan man läsa i Pelle Snickars text. Jag har också själv lite tangerat frågan i ett tidigare inlägg. Man kanske kan vara överens om att det inte vore helt fel att inkludera datoranvändning och webb i studentskrivningarna. Det skulle mer motsvara och mäta de kompetenser man behöver till exempel i arbetslivet och stora delar av studierna. Men bör vi också hålla fast vid de handskrivna uppgifterna, som ska skrivas utgående från det man har i sitt eget huvud? Ska vi tvinga barn och unga lära sig att disponera och planera en argumentation och resonemang med eftertanke innan man börjar ösa ur sig text? Att ta till sig information som blir till kunskap i huvudet, istället för att bara vara duktiga på att kryssa på informationsoceanerna och plocka lämpliga bitar och argument? Utvecklar det oss till mer eftertänksamma och djupare reflekterande människor?

Eller är det bara äldre digitala invandrares romantiserande idéer?

Undrar en som inte skrivit en längre text för hand på väldigt länge ...

tisdag 25 januari 2011

Om vetenskapligt publicerande

Inom filosofin har John Searle närmat sig förhållandet mellan språket och kommunikationen genom begreppet yttrande (utterance), en handling där en tanke får en specifik betydelse i sin specifika kontext då den uttalas med språkliga medel, som tal. I paritet till detta har Peter L. Shillingsburg lanserat en skriftteori (script theory), som innefattar skrivandet som en motsvarande handling. Processen är givetvis besläktad, det handlar om att förvandla tankar till ord och meningar, text. Men samtidigt är skrivandet annorlunda: den skrivna texten saknar tonfall, intonation. Det moderna normaliserade skrivspråket saknar otaliga nyanser, samtidigt som texterna materialiserats och kan flyttas och kopieras utom skribentens kontroll. Detta bidrar till det nödvändigtvis längre formatet. För att vara exakt och minska risken för fatala feltolkningar, måste den normaliserade texten vara omständlig och utförlig.

Eftersom det är dyrt att göra böcker, att trycka upp och distribuera dem, måste man inom det vetenskapliga publicerandet gallra innan man publicerar sig i tryck. Det som en gång var tryckt kunde dessutom sprida sig och bli läst och tolkat utom kontroll, utan tillräcklig kännedom om kontext och kritisk förståelse (att beakta är att censur i praktiken aldrig gällt ägande och läsning av texter inom samhällseliten förrän under 1900-talet, utan endast ”allmänheten” eller ”folket” samt bokbranschen och pressen). Universitet och lärda sällskap fick således en allt viktigare roll av garanter för kvalitet, för att det som trycktes var rätt och sant. Uppgiften blev allt viktigare i och med att tryckning av texter på folkspråk blev vanligare. Man lät göra mycket viktiga och nyttiga böcker om ekonomi och medicin. Samhällsfrågor kunde tidvis ventileras flitigt i pressen, den nya habermaska offentligheten fanns både i talad, handskriven och tryckt form och kommunikationen flöt emellan dessa sfärer.

En annan fråga är egentligen frågan om vad ”publicering” innebär. Ur ett subjektivt författarperspektiv handlar det oberoende av kanal eller medium om att efter en skrifthandling släppa kontrollen över en text och överlämna den åt potentiella läsare. Det handlar om att våga släppa tankar och idéer ifrån sig, med den ständigt närvarande medvetenheten om att man på intet sätt kan kontrollera hur läsaren tolkar och behandlar texten. Detta släppande är mycket mer dramatiskt när det gäller skrift än tal, eftersom ”bandvidden” är så mycket smalare och det är också mycket mer sällan du nås av respons. Då du talar inför en publik kan du hela tiden avläsa den och reagera enligt det, men denna direkta respons är närmast frånvarande i traditionellt vetenskapligt publicerande. När man väl satt sin själ och mängder av arbete på att få en vetenskaplig text publicerad, kanske efter några behandlingar på seminarier och efter granskarutlåtanden och redaktionell bearbetning, kan negativ kritik eller missbruk slå mycket hårt. Dessutom är det svårt att gå i svaromål. I ”frysta” texter kan man inte heller längre göra korrigeringar om man ändrar sig. Man måste helt enkelt publicera en helt ny artikel eller bok ...

Det säger sig självt att det borde vara klokare att istället för att satsa alla krafter på dylik långsam, arbetsdryg och också mentalt tung publicering också använda sig av lättare och mer dynamiska former av publicering, som är mindre dramatiska. Genom dessa kan man dessutom integrera andras kommentarer och kritik i texten redan under arbetet, få bort fel. Detta sagt som ett litet slag för grått publicerande.

måndag 20 april 2009

Det skrivna ordets come back

Å, vad det är roligt att läsa Tredinnick:

The telephone, television and radio all resulted in a decline in the importance of writing in the transmission of knowledge and information. Participation in culture became less a matter of mastery over a new oral discourse. If this is the case, then the digital age can perhaps be understood as inaugurating a secondary literacy. As digital technologies become more central to culture, writing has reasserted itself as the dominant mode of knowledge and information transmission. Through e-mail, wikis, blogs, social networking and instant messaging, text is becoming integral to culture, work and social relationships. We put text to more and different uses than ever before, distorting it towards communicative ends in more inventive ways. But this re-emergence of writing has brought with it a challange to the stability of textual artefacts. Text has become a more mutable and mallable medium, torn from the control of the printing houses and publishers, As we move to a secondary literacy, so our assumptions about what text represents become less secure.

Luke Tredinnick: Digital Information Culture: The individual and society in the digital age. Chadnos, 2008. s. 59.

Det spännande är hur snabbt detta skett. Det var sannolikt få som under utvecklingen och lanseringen av SMS-tekniken under början av 1980-talet som insåg vilken enorm popularitet systemet med textmeddelanden skulle få. Och den enorma kreativitet och flexibilitet som frodas i språket skulle nog vara förtjänt av mycket större forskning än vad som i dag görs. Det är först under de allra senaste åren det har börjar dyka upp pro gradu-arbeten om språket i textmeddelanden. Maria Ruotsala har t ex konstaterat att ungdomars sms-språk är närmast kaotiskt. Själv skattar jag mig lycklig att ha tonåriga barn att konsultera om all världens pwnanden ...

***

Vi förbereder som bäst det femte humanistIT-seminariet som skall handla om geografiska data inom historisk forskning. Ämnet är oerhört intressant och det finns potential till mycket ny och innovativ forskning här. Arkeologerna har ju redan tidigare upptäckt möjligheterna med dylika databaser och system. De finländska historikerna är rätt senkomna, liksom de övriga humanisterna (rätta mig om jag har fel). Det är närmast stadshistorikerna som lite flirtat med metoden, eftersom stadens rum så nära hänger ihop med stadsbilden. På andra håll av världen har redan the spatial turn fått verkligt roliga och intressanta tillämpningar.

Seminariet kommer att äga rum på Riksarkivet i Helsingfors den 4.6.2009. Den som vill ha mer info kan anmäla sig till humanistIT-e-postlistan.