„Google Docs“ išmoko atpažinti lietuviškus tekstus
Interneto Gidas
Trečiadienis, 02 kovas 2011 13:51
„Google„ savo internetinių biuro programų paketo „Google Docs“ optinio ženklų atpažinimo technologiją papildė 29 naujomis kalbomis. Šiuo metu „Google Docs“ automatiškai atpažįsta tekstus 34 pasaulio kalbomis.

Optinio ženklų atpažinimo technologiją (OCR) „Google Docs„ pradėjo naudoti praėjusių metų vasarą. Tam buvo pritaikyti kitos „Google“ paslaugos „Google Books“ sprendimai. „Google Books“ tikslas – nuskenuoti bibliotekose saugomus popierinių knygų bei periodinių leidinių fondus ir perkelti į internetą skaitmenines jų kopijas.

Iš pradžių „Google Docs" galėjo iš PDF failų ir JPG, GIF, PNG formato atvaizdų „ištraukti" tekstus penkiomis kalbomis: anglų, prancūzų, vokiečių, italų ir ispanų. Dabar „Google" atstovai oficialiame bendrovės tinklaraštyje pranešė automatinio teksto atpažinimo funkciją papildę dar 29 kalbomis.

Taigi, nuo šiol, įkėlus į „Google Docs" PDF ir minėtus grafinius failus, kuriuose yra lietuviški užrašai, galima automatiškai paversti juos tekstu, įkeltu į  „Google Docs“ tekstų redagavimo programą. Ši paslauga yra nemokama, tekstas atpažįstamas iš skeneriais gautų popierinių knygų, žurnalų ar popierinių dokumentų skaitmeninių atvaizdų arba iš skaitmeniniais fotoaparatais ar mobiliaisiais telefonais padarytų nuotraukų.

„Google" atstovai pabrėžia, kad atpažįstamo teksto tikslumas priklauso nuo pateiktų atvaizdų raiškos, tačiau ji irgi negali būti per didelė: maksimalus įkeliamo atpažinti failo dydis negali viršyti 2 MB. Rekomenduojama, kad teksto eilutės grafiniame faile aukštis nebūtų mažesnis nei 10 pikselių. Kol kas atpažįstami tik atvaizdai, kuriuose tekstas pateiktas horizontaliai iš kairės į dešinę pusę.  Dirbant su PDF failais, tekstas automatiškai „ištraukiamas“ tik iš 10 pirmųjų pateikto failo puslapių.

Skelbiama, kad „Google Docs" stengiasi atpažindama tekstą išsaugoti pirminį jo formatavimą, tačiau lentelės, skiltys ir kiti elementai gali neišlikti perkėlus rezultatus į teksto redagavimo programą.

Kol kas „Google Docs„ optinio atpažinimo paslauga gerokai nusileidžia rinkos lyderei „ABBYY FineReader“, tačiau yra nemokama. Jeigu OCR algoritmai bus toliau tobulinami, „FineReader“  ateityje gali susilaukti rimto konkurento.

Šaltinis:
 


Susijusios naujienos:

  • Kas yra daiktų internetas? (2023-10-16)

    Nesunku pastebėti, kad internetas šiandien mums suteikia itin daug įvairių galimybių: būtent dėl jo, galime bendrauti su žmonėmis iš viso pasaulio, taip pat galime ir žiūrėti filmus, klausytis muzikos, apsipirkti, surasti mums reikiamą informaciją ir t.t. Tačiau net ir tai – dar ne viskas: o, ar esate girdėję apie daiktų internetą?

  • Kaip kurti logotipus? (2021-12-03)

    Logotipas yra vizualus kiekvieno verslo veidas. Tai visur – reklamoje, socialiniuose tinkluose, pakuotėse, elektroninėse parduotuvėse ir kitose komunikacijos formose. Dažniausiai logotipas yra įsimintiniausia vizualinė prekės ženklo detalė.

  • Perkame lauko šviestuvą internetu - kas svarbu? (2020-03-24)

    Šiuolaikinė rinka mirgėte mirga nuo pačių įvairiausių prekių pasiūlymų. Ne išimtis ir šviestuvai. Visgi tai nėra toks paprastas prietaisas kaip gali pasirodyti - tinkamai pritaikytas šviestuvas yra ne tik komfortą užtikrinantis praktiškas įrenginys, bet ir puikus aplinkos jaukumo elementas. Šiandien pačių įvairiausių įrenginių galima įsigyti ir internetinėje erdvėje. Ieškote joje lauko šviestuvo? Į ką turėtume atkreipti didžiausią dėmesį?

  • Draudimo skaičiuoklė internete - kad rastumėte geriausią pasiūlymą (2019-10-17)

    Renkatės naują automobilį, bet nežinote į ką atkreipti dėmesį, kad už jį nepermokėtumėte? Štai keletas patarimų kaip išvengti didesnių draudimo išlaidų įsigyjant transporto priemonę.

  • Pigiausias internetas Kaune: kaip tokį atrasti? (2017-06-14)

    Ar galite įsivaizduoti savo gyvenimą be interneto, kuris lydi mus kiekviename žingsnyje. Turbūt sunkiai, kadangi internetas yra ne tik pramogos, tačiau ir darbo priemonė. Juolab, įprastus darbus jis mums padeda atlikti kur kas geriau, o šiuolaikiniame pasaulyje labai svarbus laiko taupymo aspektas. Visgi, šiuo metu interneto paslaugas teikia tiek daug tiekėjų, kad gali būti sunku pasirinkti, kuris variantas Jums tinka labiausiai. Pigiausias internetas Kaune nebūtinai yra blogiausias kaip kartais priimta manyti. Pigumas taip pat gali reikšti kokybę, tik reikia mokėti ieškoti ir atradus priimti pasiūlymą.


Komentarai

Reklaminis skydelis

Naudingos nuorodos

ManoIT.lt









Mūsų draugai

It naujienos

Deviceinformed