Forum Użytkowników nawigacji NaviExpert

Dyskusje na temat nawigacji NaviExpert w telefonach komórkowych i nie tylko. Zapraszamy do aktywnego udziału. Wyraź Swoją opinię lub podziel się własnymi doświadczeniami Użytkownika mobilnej nawigacji NaviExpert.

Przejdź do zawartości

FAQ |Zarejestruj | Zaloguj

Propozycja nowej funkcjonalności: sterowanie głosem

Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez EgonW3 » sobota, 6 lis 2010, 15:44

Właśnie bawiłem się wyszukiwaniem głosowym po polsku w Androidzie i działa to rewelacyjnie. Tak sobie pomyślałem, że pewnie Google udostępnia jakieś API i dałoby się w oparciu o to zrobić wprowadzanie adresów do programu. To byłby hicior! :)
EgonW3
Użytkownik forum Użytkownik forum
Użytkownik NaviExpert Użytkownik NaviExpert
 
Posty: 10
Dołączył(a): środa, 30 wrz 2009, 20:17
Telefon: Samsung Galaxy S i9000

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez roman_tp » sobota, 6 lis 2010, 16:35

chcesz się kłócić z osobą podpowiadającą gdzie masz jechać? :lol:

takie rzeczy to tylko......, ale nie w JAVA [bo nie ma wersji na ANDROID'a]. obecna wersja wykluczyła grupę telefonów, chcesz jeszcze uszczuplić grupę, na których działałby NE?
Avatar użytkownika
roman_tp
Użytkownik NaviExpert Użytkownik NaviExpert
Użytkownik forum Użytkownik forum
 
Posty: 673
Dołączył(a): czwartek, 16 lip 2009, 13:35
Lokalizacja: Lusówko
Telefon: CAT B15

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez lukasz » niedziela, 7 lis 2010, 20:23

Popieram tą ideę.
Mam nadzieję że już nad tym pracują :)
Myślę, że problemem w rozwoju w NE jest właśnie to, że ma pracować na czym się tylko da. Programiście zamiast się skupić na pchaniu NE do przodu i wdrażaniu nowych technologii, tracą czas na dostosowywaniu aplikacji na różne telefony. Problemu takiego nie było gdy była to prosta wersja 1.2. Poza tym nie było tak dużej różnorodności telefonów.
lukasz
Użytkownik NaviExpert Użytkownik NaviExpert
Użytkownik forum Użytkownik forum
 
Posty: 23
Dołączył(a): środa, 29 lip 2009, 11:58
Telefon: Mi5

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez Spychacz » środa, 10 lis 2010, 05:02

przecież NE ma problemy z informowaniem głosem (mówi skręć w prawo, a droga wskazana jest prosto - informowało o tym kilku uzytkowników) więc co tu dopiero mówić o sterowaniu głosem :D
Spychacz
Użytkownik forum Użytkownik forum
Użytkownik NaviExpert Użytkownik NaviExpert
 
Posty: 144
Dołączył(a): środa, 6 sty 2010, 18:33
Lokalizacja: Poznań
Telefon: Nokia Lumia 720

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez KasiaD » środa, 17 lis 2010, 17:40

Romanie, w połowie Tak, w połowie Nie... Nie, bo w Javie nie jest to łatwe, ale możliwe... Tak, bo prawdopodobnie uciągnęłyby taką funkcjonalność jedynie mocniejsze telefony...
...in space no one can hear your scream...
KasiaD
Pracownik NaviExpert Pracownik NaviExpert
Użytkownik forum Użytkownik forum
 
Posty: 862
Dołączył(a): czwartek, 22 lip 2010, 09:44
Telefon: Samsung S9

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez krzyszt_off_74 » czwartek, 18 lis 2010, 11:15

Hicior, Hicior same Hiciory. A jesli chodzi o nawigowanie, to już doszło do tego, że mimo iż mam długi abonament NE, to i tak włączam tępy, prosty i byle jaki Drogowskaźnik. Bo mimo, że nie ma w sobie nawet podstawowych narzędzi przydatnych w nawigacji, nie mówiąc już o Hiciorach, to ma jedną jak dla mnie wielką zaletę. Prowadzi i układa trasy jak należy, a nie kręci mnie jak baczęk po pustym mieście żeby ominąć nie istniejący korek. A dodam też, że nie jestem w Plus GSM, bo tylko pod tą marką i jej pochodnymi można mieć Drogowskaźnik. Jest tak, że kupuję sobie oddzielnie małą kartę pre-paid 36,6. Także błagam Was. zlitujcie się z tymi hitami, które z reguły w wydaniu NE i tak kiepsko pracują. I nie czepiajcie się, bo to nie jest żadna reklama Drogowskaźnika.
Avatar użytkownika
krzyszt_off_74
Użytkownik forum Użytkownik forum
Użytkownik NaviExpert Użytkownik NaviExpert
 
Posty: 74
Dołączył(a): czwartek, 9 lip 2009, 19:35
Lokalizacja: Starogard Gdański
Telefon: SE U8i Vivaz Pr + Navibe GB735

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez KasiaD » czwartek, 18 lis 2010, 11:43

Krzyszf_off'ie... gdzież bym śmiała się czepiać ;) Nikt Cię łańcuchem do NE nie przykuwa... a co do Hiciorów tudzież wodotrysków, jak to nazywacie, nikt nie powiedział, że to zostanie wprowadzone ;)... a jak już koniecznie chcesz się czepiać, to czepiaj się pomysłodawców, bo jak widzisz amatorzy wodotrysków również istnieją ;)
...in space no one can hear your scream...
KasiaD
Pracownik NaviExpert Pracownik NaviExpert
Użytkownik forum Użytkownik forum
 
Posty: 862
Dołączył(a): czwartek, 22 lip 2010, 09:44
Telefon: Samsung S9

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez navtek » wtorek, 23 lis 2010, 10:51

Sterowanie głosem, czyli voice control, to rozwiązanie znane z telefonów komórkowych, nawigacji i dziesiątków aplikacji.
Różnica jest taka, że język polski jest językiem fleksyjnym i ilość komend, które powinny być rozumiane i powinny oznaczać to samo, znacznie wzrasta i
aplikacja do voice recognition musi działać szybciej i efektywniej, procesor musi być szybszy i pitrzebna jest biblioteka do natural voice recognition,
aby system zrozumiał "jadę do Warszawy", "Warszawa", do Warszawy" jako jednoznaczną komendę wybou Warszawy za miejsce docelowe.

Poza tym voice control działa wolniej niż ręczne wpisywanie w menu.
Wybór opcji z menu to jest jeden klik, a wypowiedzenie nazwy opcji z menu trwa 1 sekundę i dłużej.
Dlatego używa się mixed systems, czyli systemów sterowania głosem , połączonych z aktywnym menu i wirtualną klikaną klawiaturą.

Pozostaje jeszcze problem kasowania błędnie rozpoznanych komend, powtarzania nierozpoznanych komend itd.

Ale w celach developerskich używa się szybkiej stacji roboczej i na niej się emuluje działanie systemu voice control + voice recognition,
a dopiero, gdy testy zakończą się sukcesem, przenosi się bibliotekio voice recognition, voice control do znacznie wolniejszego OS nawigacji samochodowej.

Teoretycznie, voice control, można już dziś wprowadzić do większości nawigacji, także tych obsługiwanych w języku polskim, ale to nadal nie będzie jeszcze
Natural Human Interface .

Aby w ogóle rozpocząć pracę nad inteligentną nawigacją , należy znaleźć rynek zbytu na co najmniej milion egzemplarzy i wtedy opcją jest system voice control obsługiwany w języku angielskim, bo rynki to US, Kanada, Australia, Anglia, Irlandia ...
Tyle że nowa nawigacja nie jest kupowana w sklepie a preinstalowana przez producenta samochodów.
A milion samochodów luksusowych z inteligentną nawigacją może wyprodukować Japonia, Korea, Stany
ale rynkjiem docelowym i tak będą Stany.

Czyli inteligentna nawigacja samochodowa z Natural Human Interface, voice control to nawigacja z językiem angielskim i gdy okaże się sukcesem,
wersja z językiem polskim pojawi się za następnych lat.

Czy voice control to wygoda, czy uciążliwość, to łatwo sprawdzić instalując na pececie liczne aplikacje do obsługi komputera komendami głosowymi.

Jak dotychczas, łatwiejsza, bardziej intuicyjna i szybsza jest obsługa komputera z klawiatury, szybsze jest wpisywanie tekstu niż wprowadzanie ich głosowe.

Podobnie jest z czytaniem.
Szybsze jest czytanie tekstu pisanego niż odsłuchiwanie informacji głosowej.
Speed reader, czyli szybkoczytacz może dziennie przeczytać 1000 stron tekstu, a odsłuchać tylko tyle, ile trwa nagranie, czy synteza głosu.
Są znane oczywiście rozwiązania typu przyspieszone czytanie, synteza mowy, głosu, ale są to nadal rozwiązania koncepcyjne.

Poza tym, w przypadku nawigacji samochodowej, sterowanej głosem, należałoby oczekiwać potwierdzania każdej komendy głosem przez system,
aby uniknąć przekłamań, niejednoznaczności i błędów rozpoznania komendy, a to już zwiększy latencję interakcji o kolejne 100% .

Powtarzanie komend można oczywiście wyłączyć, gdy wyświetlacz nawigacji jest widoczny, czytelny i można rozpoznane komendy weryfikować na żywo, naocznie, ale jest to jednak kolejny problem do rozwiązania.

Czyli teoretycznie można już dziś zaoferować nawigację samochodową ze sterowaniem głosem w języku polskim i testować różne koncepcje, rozwiązania, algorytmy, ale trudno będzie sprzedać taki produkt na rynku w 100,000 egzemplarzy i za przyzwoitą cenę, gdy rynek jest zapełniony tanimi nawigacjami od 100 $.

Wtedy taką inteligentną nawigację można wprowadzić na rynek jedynie za pośrednictwem producentów samochodów (patrz wyżej), jako dodatkowe wyposażenie samochodu, gdyż wtedy cena nie jest taka istotna, bo taka nawigacja, oferowana jako dodatkowe wyposażenie (a może standardowe),
będzie mogła zostać sprzedana na raty, tak jak sp[rzedawany jest samochód i klient nie odczuje w kieszeni istotnej różnicy w cenie.

Ale do tego konieczny jest już gotowy, przetestowany produkt z homologacją i rozmowy z producentami samochodów.
W Niemczech jest rynek na tego typu nawigacje i są producenci oferujący takie nawigacje wbudowane do samochodu.

Oczywiście, dużo łatwiej budować taką aplikację na telefon komórkowy i jeszcze łatwiej gdy aplikacja jest otwarta i oferuje API.
Niestety NE nie jest ani aplikacją otwartą, ani API do voice control nie jest oferowane, co właściwie zamyka temat
do czasu zmiany koncepcji rozwojowej NE.

Jest Voice Control dla Windows, czyli teoretyucznie dla Windows Mobile i dla komórek, nawigacji opartych na Windows Mobile.
Jest voice Control dla Linuxa i projekt Nokia Maemo dla Nokia Internet Tablet obejmował takie rozwiązania, tyle że rynek po stronie kupujących był zbyt mały.
Apple's iPhone oferuje aplikacje typu Voice Control + API + nawigacje na telefon i rynek obejmuje miliony użytkowników.
Nokia's Symbian to miliony użyutkowników, ale obecna wersja OS ma ograniczenia dla Voice Control i Natural Human Interface
Google's Android to wielki rynek, tysiące developerów i tutaj można szukać rozwiązań i rynku.

Zatem rynek jest otwarty.

Wielkie nadzieje producenci nawigacji samochodowych wiążą z Google Maps / Traffic Live,
jako globalnym systemem nawigacji samochodowej.
I w tym kierunku zmierza Google z własną nawigacją + komendy głosowe
i Google oferuje API , mapy, a rynek to dziesiątki milionów takiej globalnej nawigacji.

Znajomy zrobił nawigację dla Nokia Internet Tablet (Maemo Project) pod Linuxa, Debian i po sukcesie swojej nawigacji, opartej na mapach Google Maps, Google Satellite + routing, komenty głosowe + Traffic Live, przeszedł do Google .

Czyli globalnym liderem wydaje się być Google, jako że ma mapy, nawigację, kontroluje Androida i ma potencjał finansowy, rozwojowy + miliony użytkowników.

Nawigacja z Google Maps + routing + komendy tekstowe, już została właczona do nawigacji samochodowych i komendy tekstowe aplikacji Google są używane do generowania komend głosowych przez wbudowaną nawigację samochodową.

Jak się produkt sprawdzi na rynku, to znajdzie dziesiątki miliony klientów i wyznaczy trend nawigacji samochodowej opartej o Internet (GPRS, 3G).

Na szczęście nawigacja dla Nokia Internet Tablet umożliwia zapisanie elementów map do pamięci przed podróżą,
a Nokia oferuje swoje mapy za darmo i na karcie pamięci, zatem komunikacja z Internetem będzie mogła zostać ograniczona jedynie do routingu i aktualizacji informacji o korkach, Traffic Live, bez konieczności ładowania map tras w locie z Internetu.

Navteq's developer LBS
navtek
Użytkownik forum Użytkownik forum
 
Posty: 46
Dołączył(a): sobota, 20 lis 2010, 13:11

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez jotde » wtorek, 23 lis 2010, 12:12

Bardzo ciekawa wypowiedź, przeczytałem z dużym zainteresowaniem, dzięki.

navtek napisał(a):Poza tym voice control działa wolniej niż ręczne wpisywanie w menu.
Wybór opcji z menu to jest jeden klik, a wypowiedzenie nazwy opcji z menu trwa 1 sekundę i dłużej.


Jedynie mógłbym się odnieść do cytowanego fragmentu. Oczywiście jak trzeba przeklikać przez menu, poczekać na aktywację, a potem jeszcze potwierdzić że system zrozumiał to głosowo trwa dłużej. Kluczem do sterowania głosem jest osiągnięcie poziomu inteligencji programu na którym będzie wystarczyło powiedzieć "Nawigacja... prowadź na ulicę Polską 14", a nawigacja sama się uaktywni (na słowo kluczowe) i "domyśli", że skoro nie ma nazwy miasto to pewnie chcę jechać w mieście w którym jestem, ewentualnie zsyntetyzuje głosowo swoje rozumienie polecenia, żeby dać informację zwrotną, że wszystko jest poprawne. W efekcie potrwa to znacznie krócej niż klikanie i, co najważniejsze, zajmie o wiele krócej uwagę kierowcy (szczególnie wzrokową). Ale to jeszcze trochę pracy nad algorytmami, szczególnie do języka polskiego. Choć muszę przyznać, że wyszukiwanie głosem w google apps na mojej noki jest całkiem, całkiem - ostatnio rozpoznała poprawnie hasło "aperitif" :)
Avatar użytkownika
jotde
Użytkownik NaviExpert Użytkownik NaviExpert
Użytkownik forum Użytkownik forum
 
Posty: 316
Dołączył(a): wtorek, 1 wrz 2009, 10:21
Telefon: Samsung GT-i8160

Re: Propozycja nowej funkcjonalności: sterowanie głosem

Postprzez navtek » wtorek, 23 lis 2010, 14:45

"będzie wystarczyło powiedzieć "Nawigacja... prowadź na ulicę Polską 14", a nawigacja sama się uaktywni (na słowo kluczowe) i "domyśli", że skoro nie ma nazwy miasto to pewnie chcę jechać w mieście w którym jestem,
"

Dokładnie o tym pisałem.
"Nawigacja... prowadź na ulicę Polską 14"
"Nawigacjo... prowadź na ulicę Polską 14"
"Nawigacjo... jedź na ulicę Polską 14"
"Nawigacjo... ulica Polską 14"
"Nawigacjo... szukaj ulicę Polską 14"
...

Ma oznaczać tę samą komendę głosową, polecenie dla nawigacji.
Czyli problem voice recognition dla języka polskiego to i fleksja i semantyka, czyli znaczenie, nie mówiąc już o parserze do składni.

Ale ten problem został już rozwiązany od strony technicznej w lotnictwie i został opisany instrukcjami komunikacji pilota z wieżą, kontrolerem ruchu.
Czyli uproszczony, ale jednoznaczny język komunikacji + potwierdzanie komend.

Platformą testową dla systemów obsługiwanych komendami głosowymi jest obecnie telefonia cyfrowa Asterisk by Digium i systemy call center IVR.
Asterisk oferuje nagrywanie rozmów telefonicznych, przez co ułatwia tworzenie list dialogowych i analizę semantyczną poprawności działania modułów voice recognition.

W zespole Google Maps / Traffic Live pracuje wiele osób ale tylko kilku liderów i projekt jest przewidywalny i łatwo się dołaczyć, co sam zrobiłem kilka lat temu.

Dyrektor d/s innowacji w Nokii, Luca, jest bardzo życzliwy i zainteresowany nowymi propozycjami, projektami.

Podobnie NAVTEQ.

Czyli teoretycznie wszyscy są zainteresowani, a rynek zbytu to tak nawigacje samochodowe, jak i systemy call center IVR.
Korporacyjne systemy call center IVR to rynek o wartości dziesiątków milionów w Polsce i miliardów na świecie.

Moduł syntezy głosu został już dołączony w wersji polskiej, bo w wersji angielskiej znany jest z Linuxa od dlugiego czasu i jakość syntezy głosu jest doskonała.
Synteza głosu w wersji polskiej jest oceniana przez niektórych jako depresyjna, sztuczna, a głos brzmi syntetycznie jak u robotów.
Niepotrzebnie nagrano do syntezy głos "wywyższający się, nie znający sprzeciwu".

Wiele firm preferuje naturalne, sympatyczne, miłe głosy naturalne w call center, gdyż to nie odstrasza klientów.

Zaprzyjaźniona firma ze Swecji opracowała doskonałe narzędzia do surface computing, multi-touch, czyli do obsługi komputera dotykiem i odniosła duży sukces biznesowy w Dubaju, bo tam jest dostępny kapitał inwestujący w innowacje.

Opera i inni oferują rozpoznawanie twarzy, gestów do sterowania przeglądarką internetową.

Droga do pełnego wdrożenia voice control w telefonach, telewizorach, kamerach, aparatach fotograficznych, komputerach,
jest jeszcze daleka, ale rynek się rozwija i zainteresowanie po stronie klientów, użytkowników sprzętu jest duże.

Bankomaty sterowane głosem zamiast menu + identyfikacja użytkownika na podstawie analizy głosu ?

Z uwagi na globalizację, takie rozwiązania pojawią się już wkrótce i trafią także do nawigacji samochodowych, w skali globalnej.
navtek
Użytkownik forum Użytkownik forum
 
Posty: 46
Dołączył(a): sobota, 20 lis 2010, 13:11

Następna strona

Powrót do Ogólne

Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 1 gość

cron
Obserwuj nas na Facebooku Strona gwna NaviExpert NaviExpert Newsletter Blog NaviExpert