Új hozzászólás Aktív témák

  • Robitrix

    senior tag

    válasz cog777 #6 üzenetére

    Azért egy telefonon nem igen van meg az elég kapacitás ahhoz, hogy helyben megfejtse, hogy mit hall. És nem is feltétlenül a CPU/GPU teljesítményen múlik hanem a háttérben levő sok TB-os adatbázisokon. Azért ahhoz, hogy bediktáld érces borízű hangon, hogy "Béla hozd vissza fogómat vagy pofán váglak!" Mint klasszikus pályaudvari hangos bemondónál. igen sok féle változatban kell ott lenni a szavaknak vagy mondatoknak. Nem tudom szavakat vagy mondatokat ismer fel a rendszer, mert egy magányos szót másként ejtünk ki, mint mondjuk egy mondatban szó kapcsolatban, amikor hatnak rá az előtte és utána kiejtett szavak is. más lehet a hangszín és hangmagasság annak függvényében, hogy kérdezek, állítok vagy felkiáltok éppen. Vagyis még ugyn az az ember is meglehetősen eltérően ejtheti ki ugyan azt hét még sok millió ember, aki tuti nem egyformán beszél azért. Mi emberek tapasztalati úton tanulva nagyjából megértjük egymást nagyjából vagy nem. :) Legalább is azonos nyelvterületen. Ennek ellenére nem mindig érthető, hogy mit mond a másik pontosan. :) Egy számítógépes szöveg értés ennél jóval butább és korlátozott, de kétségtelenül évről évre "okosodnak" a rendszerek.

Új hozzászólás Aktív témák