Радостин Чолаков – 15-годишният програмист, създадел на АзБуки.МЛ

Хора
Хора
Радостин Чолаков - 15-годишният програмист, създадел на АзБуки.МЛ
/

Радостин Чолаков е млад програмист, едва петнайсетгодишен, започнал да се занимава с разработка на софтуер още на 9 години. Той има зад гърба си множество успешни проекти, спечелени състезания и стипендии, разработки на цели мобилни приложения, които се радват на голям интерес (можете да ги изтеглите от Google Play). В момента Радостин се е заел с една много патриотична задача. А именно, да научи алгоритмите да говорят български. Проектът му се нарича АзБуки.МЛ и сега Ради ще ни разкаже повече за него.

В момента разработваш софтуера за обработка на български език, наречен АзБуки.ML. Какво представлява той?

Проектът АзБуки.ML е онлайн платформа, предоставяща съвкупност от алгоритми и модели с изкуствен интелект, които да могат да обработват българския език. Това включва корекция на граматични и пунктуационни грешки, генериране на текстове, синтезиране на гласов прочит от написан текст, резюмиране, оценка на настроението в текстовете. Целта ни е да подготвим тези инструменти като услуга за разработчици, компании или изследователи, които не задължително имат познания в NLP сферата.

Как ти хрумна идеята?

Идеята е вдъхновена от подобни модели за английския език, които стоят зад гласовите асистенти на Гугъл и Епъл. Разработвал съм приложения за тях и винаги съм се дразнил, че нямат поддръжка за български.

Какви предимства има изкуственият интелект при обработката на езика в сравнение с традиционните методи на програмиране?

Силата на невронните мрежи е, че сами успяват да открият шаблон за решаването на даден проблем измежду голямо количество от данни. Или по-просто казано – представете си две-годишно детенце, което карате да каже думата “прахосмукачка”. Вие му я повтаряте, а в началото то ви гледа странно. Когато се престраши да опита и каже “пасукачка” или “прахокачка” вие се смеете и го поправяте: “пра-хо-сму-кач-ка”. След още няколко опита думата вече е научена.

Алгоритмите, които използваме в платформата правят същото. Опитват се да наподобят начина, по който истинските невронни мрежи работят. Например в модула за поставяне на запетаи на АзБуки.ML съм събрал текстове от хиляди книги. След всяко изречение моделът се опитва да познае къде има запетая, а след това “поглежда” правилния отговор и се коригира при грешка, така както детенцето от “пасукачка” ще стигне евентуално до “прахосмукачка”.

Това прави невронните мрежи подходящи за по-абстрактна обработка на данните. Със стандартно програмиране можете да се опитате да напишете код за всяко едно граматично правило, но възникват два основни проблема. Първо, правилата и техните изключения са прекалено много и второ, някои от тях изискват човек да ги разтълкува. Изкуственият интелект обаче сам открива тези правила и започва да ги прилага.

Използваш ли друг готов софтуер, който работи на български, или сам разработваш всичко?

Опитвам се да не преоткривам топлата вода и затова програмите, които разработвам са или неподдържани на езика ни до момента, или са подобрение чрез нов подход на нещо, което съм видял че съществува. Има обаче и множество трудове на изследователи в сферата на лингвистиката, или филологията, на които съм се позовавал. Както и такива, които лично са ми помагали и на които съм безкрайно благодарен.

Как се запали по програмирането на толкова ранна възраст и какви пречки срещаш по пътя си?

Историята за запалването ми по програмирането стана доста известна. Накратко – в трети клас бях голям любопитко. Една вечер видях съпруга на леля ми, който програмираше нещо и когато получих лаптоп започнах и аз да се опитвам.

Най-съществената трудност, особено в началото, е просто да се пребориш със себе си, за да можеш, когато нещо не се получава, да не се отказваш. Тъй като трябваше да се уча сам през почти цялото време, имаше множество ситуации, в които правих доста глупави грешки. Нямам си на представа как нещо трябва да се направи и все пак искам да го направя.

Мога дори да ви разкажа историйка. Бях в четвърти клас, когато си бях наумил, че ще създам свой сайт за електронна поща, подобен на Gmail. Мъчих го цели 4 месеца и направих изключително много неща. Един ден си взех телефона в училище, за да разпространя творението си. Когато отворих сайта обаче, целият екран светна в червено!

Почувствах как ръцете и краката ми станаха ледено студени. Забързах се да довърша уроците и задачите, че да мога да си тръгна по-рано от занималнята. Когато се прибрах и осъзнах какво се е случило, се изплаших още повече. Администраторът на хостинга бе обновил версията на системата и почти всичко трябваше да се преправи. 

Неконтролируема тъга се насъбра у мен и от очите ми закапаха едри сълзи. Поплаках си, но предпазливо – да не ме забележи мама. Когато неконтролируемата тъга отмина се погледнах в огледалото, сръчно избърсах сълзите си, стиснах силно зъби и с цялата сериозност, която може да излезе от едно десетгодишно момченце, казах на висок тон “Ще го оправя пък!”. След още 3 седмици беше оправено. Ако се бях отказал нямаше да имам нито функциониращ сайт, нито знанията как се работи с новата версия на PHP. От тогава, каквато и трудност да срещна, просто не се отказвам, докато тя не се откаже.

Какви приложения има АзБуки.ML и кои са твоите потенциални клиенти? 

Възможните приложения на подобен софтуер са наистина много. Ето няколко – анализ на настроението може да бъде приложен в онлайн магазините, които да измерват успеваемостта на продуктите си чрез коментарите на потребителите. Медийните уеб сайтове могат да вградят в статиите си гласов прочит на текста. Разработчиците на чатботове и други умни помощници могат да интегрират модула за граматичен анализ.

Коя е следващата функционалност, която смяташ да развиеш в софтуера, и какви са следващите стъпки за Азбуки?

В момента работим активно по подобряването на качеството на гласовите синтезатори за българския език, за да създадем още по-реалистичен прочит на текстове с човешки глас. Тази технология има голям потенциал, защото с нея могат да бъдат разрешавани разнородни проблеми, включително и да направи българския интернет достъпен за хора със зрителни проблеми, които не могат да четат, например.

Ради със сигурност е човек с голям талант и човек, чиято работа си струва да бъде следена. Приложенията на технологията на АзБуки са най-разнородни, но общото между тях е, че те всички подобряват с нещо употребата на българския език. Помагат на хората да пишат, слушат, четат и говорят по-лесно и по-правилно. А самият софтуер тепърва ще се развива и ще става все по-добър и по-човешки. 

*Този текст беше прочетен от гласовият синтезатор на АзБуки.МЛ, които са партньори и съмишленици на Хора.

Деница Йончева

Leave a Reply

Your email address will not be published. Required fields are marked *