С навлизането на ново поколение технологии, българският език е застрашен от отмиране в дигиталната епоха.
Това показва изследване на водещи европейски експерти в сферата на езиковите технологии, съобщават от Българската академия на науките.
Изследването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин".
Изследването на водещи европейски експерти в сферата на езиковите технологии показва, че повечето европейски езици са заплашени от дигитална смърт. Според проучването шансът на много от европейските езици да оцелеят в дигиталната епоха не е голям.
Изследователите са направили оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа. Експертите са достигнали до извода, че езиковите технологии за 21 от 30-те изследвани езика или „са недоразвити", или са „слабо развити".
Проучването е проведено от над 200 експерти и е обобщено в Бели книги за различните езици (30 на брой), които са публикувани от META-NET (печатни издания и онлайн) и включват обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.
В поне една от тези категории 21 от 30-те езика (т. е. 70%) получават най-ниската оценка (т. е. за тях липсват езикови технологии или съществуващите технологии са недоразвити).
За българският език категорията със слаба оценка е автоматичният превод.
Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории. Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично" за нито един език. Ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити".
Технологиите и ресурсите за езици като баски, български, каталански, гръцки, унгарски и полски са категоризирани като „фрагментарно развити", което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.
Това означава, че в момента българският език (получил средна оценка в категориите обработка на реч, анализ на текст и общо състояние на езиковите ресурси) не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици.
„Резултатите от проведения от нас анализ са силно обезпокоителни. По-голямата част от европейските езици не разполагат с достатъчно количество адекватни ресурси, които да гарантират оцеляването им в епохата на развити технологии, а при някои езици дори нуждата от такива ресурси не е била осъзната. Поради тази причина и бъдещето на много от европейските езици е неясно", казва проф. Ханс Уцкорайт - координатор на инициативата META-NET, научен директор на Германския център за проучване на изкуствения интелект (DFKI) и един от авторите и редакторите на изследването.
Друг от редакторите - Георг Рем (DFKI), добавя: „Наблюдаваме драстично разминаване в равнището на състоянието и достъпа до езиковите технологии за различните европейски езици и за различните технологични области. Пропастта между т. нар. „големи" и „малки" езици продължава да се разширява. Трябва да положим усилия, за да осигурим адекватна технологична подкрепа за всички по-малки езици, за които липсват нужните ресурси и технологии. В противен случай те за застрашени от дигитална смърт."
На 26 септември Съветът на Европа отбелязва Европейския ден на езиците, на който се чества езиковото многообразие и се подчертава значението на развитието на богатите езикови и културни ресурси, с които разполага нашият континент. Задачата на META-NET е ясно да очертае предизвикателствата и възможностите, които очакват езиковото ни наследство в информационната епоха.
krlrat
на 25.09.2012 в 17:39:16 #13Споко, Доган вече му е намерил заместник....
a69
на 25.09.2012 в 17:27:59 #12Страшни глупости. Българският не бил застъпен от машинните преводи, дрън-дрън. Тези данни ако са предоставени от БАН, значи там не са си показвали носа навън в последните 10 години. Пример: http://itranslate4.eu - с българско участие (но не БАН) и ФИНАНСИРАН от ЕК. http://itunes.apple.com/us/app/7-in-1-offline-translator/id498493962 https://play.google.com/store/apps/details?id=com.skycode.atrance Това че горепосочените продукти са частна инициатива, не значи че за българския няма машинен превод, анализ на синтаксиса и т.н. Тези продукти ги има ВЪПРЕКИ усилията на БАН.
ТеНеТеМе
на 25.09.2012 в 17:20:39 #11Метин1, необразован си и пак го показваш. Ето ти една карта , за да си запълниш празнината в главата. Кирилицата е много голяма работа и нема скоро да умре. На нея пишат дори в Монголия. http://es.wikipedia.org/wiki/Archivo:Cyrillic_alphabet_distribution_map.png
Матю
на 25.09.2012 в 17:00:36 #10Явно виждам по друг начин нещата. Езикът ни няма как да е застрашен от технологиите. Българският е заплашен единствено и изключително от българите и от никой друг.

slonikon
на 25.09.2012 в 16:35:44 #9кажи го на милиард и половина китайци, близо половин милиард араби, индийци и пр.
Nigel
на 25.09.2012 в 15:28:21 #8бББ, много ми се иска да си прав за автоматичния превод. Обаче в момента чета едни тръжни книжа преведени вероятно с машинен превод - добре че знам за какво става дума, та мога и да разбера криво-ляво текста. Е, преводът наистина не е от английски и освен това е на технически текст, вероятно това е част от причината да е толкова зле. Но мисля че до няколко години нещата ще се подобрят чувствително. Напредъкът отпреди само някакви си 20 години е просто невероятен!
Христо Тамарин
на 25.09.2012 в 15:05:07 #7http://www.meta-net.eu/whitepapers/key-results-and-cross-language-comparison
sVinete pod noJa
на 25.09.2012 в 14:58:03 #6mnogo vajno na koi mu dreme
Negru tigani
на 25.09.2012 в 14:51:24 #5ТеНеТеМе е много близко до истината. Има едни кинти по линия на ЕС, които трябва да се усвоят. Това е. Предполага се, че само във Фейсбук има 2млн. българи. Е, 100000 да не пишат на български. Останалите? Предполагам ВСИЧКИ електронни книги поддържат кирилица, поне заради руснаците. Каква дигитална смърт гони езика ни не знам. 500г. османският боздуган не го е убил, че една електронна джаджа ли ще го направи.
бББ
на 25.09.2012 в 14:51:13 #4Какво му е лошото на автоматичния превод от/на български? Работи си. Между другото и речевото разпознаване на гугъл (това, дето е вградено в андроидите и в хром), също работи много яко. П.С.А за иврита какво?
ТеНеТеМе
на 25.09.2012 в 14:18:48 #3Та ... убиец на българския език няма да е с дигитален произход, а с лайнян - като Пешо Стоянов - призидентин, дето искаше парелелно да вкара шлокавицата по конституция.
ТеНеТеМе
на 25.09.2012 в 14:10:06 #2Твърде сложна статия за мен. Нищо не разбрах.
Или просто има феодални старчета и из Европа, усвояващи едни пари?!?
Иначе живеем в технологични времена и не вярвам вкарването на българския език в изискваните дигитални рамки да се нуждае от голямо технологично време .... ако е спешно.
Извън тази сложна материя, бих казал , че интернет в последните години подобри българския език. Хората се принудиха да пишат и да се изразяват по правилно на български.
iXact
на 25.09.2012 в 14:09:22 #1Че кое му е страшното. Един език служи за комуникация между хората (и компютрите вече) и ако не изпълнява тази си роля или трябва да се развива или да замира.