Шта је препознавање говора?

Употреба вашег гласа као метод уноса

Препознавање говора је технологија која омогућава говорни унос у системе. Разговарате с вашим рачунаром, телефоном или уређајем и он користи оно што сте рекли као улаз да бисте покренули неку акцију. Технологија се користи да замени друге методе уноса као што су куцање, клик или избор на друге начине. То је начин да направите уређаје и софтвер више корисницима и да повећате продуктивност.

Постоји доста апликација и подручја у којима се користи препознавање говора, укључујући и војску, као помоћ за оштећене особе (замислите особу са оштећеним или без руку или прстију), на медицинском пољу, у роботици итд. У блиској будућности, скоро сви ће бити изложени препознавању говора због његовог ширења међу заједничким уређајима као што су рачунари и мобилни телефони.

Одређени паметни телефони занимљиво користе препознавање говора. Примери тога су иПхоне и Андроид уређаји. Преко њих, можете покренути позив на контакт само тако што ћете добити упућене инструкције као што су 'Позивница'. Могуће је забављати и друге команде, попут 'Укључити Блуетоотх'.

Проблеми са препознавањем говора

Препознавање говора, у својој верзији познатој као Говор у текст (СТТ), такође се дуго користи за превођење изговараних ријечи у текст. "Причаш, то типи", као што би ВиаВоице рекао на својој кутији. Али постоји један проблем са СТТ-ом, као што знамо. Више од 10 година уназад, пробао сам ВиаВоице и није прошао недељу дана на мом рачунару. Зашто? Било је јако нетачно, и завршио сам проводио више времена и енергије говорећи и исправљајући него што све куцам. ВиаВоице је један од најбољих у индустрији, па замислите остало. Технологија је сазрела и побољшала, али говор на текст још увек чини људе постављањем питања. Једна од његових главних потешкоћа је огромна варијација људи у изговарању речи.

Нису сви језици предвиђени за препознавање говора, а они који често не подржавају, као и енглески језик. Као резултат, већина уређаја који покрећу софтвер за препознавање говора раде разумно само са енглеским језиком.

Низ хардверских захтева у одређеним случајевима отежава препознавање говора. Потребан вам је микрофон који је довољно интелигентан за филтрирање позадинског шума, али у исто вријеме довољно снажан да природно прима звук.

Говорећи о шуму у позадини, може проузроковати неуспјех читавог система. Као резултат тога, препознавање говора у многим случајевима не успије због гласова који су ван корисничке контроле.

Препознавање говора се показало бољим као метод уноса за нове телефоне и комуникационе технологије попут ВоИП-а, него као алат за продуктивност за уношење малог текста.

Примене препознавања говора

Технологија постаје популарна у многим областима и била је успешна у следећем:

- Контрола уређаја. Само кажем "ОК Гоогле" за Андроид телефон покреће систем који је ушију у ваше гласовне команде.

- Аутомобилски Блуетоотх системи. Многи аутомобили су опремљени системом који повезује свој радио-механизам са вашим паметним телефоном путем Блуетоотх-а. Тада можете упућивати и примати позиве без додиривања паметног телефона и чак можете упућивати бројеве само тако што ћете их рећи.

- Говорна транскрипција. У подручјима на којима људи морају пуно откуцати, неки интелигентни софтвер прикупља своје изговорене речи и их преписује у текст. Ово је тренутно у одређеном софтверу за обраду текста. Говорна транскрипција такође ради са визуелном говорном поштом .