Skip to main content

Wersja systemu 0.104.5 Słucham Cię

· 4 min read

"Słucham Cię" to motto naszego projektu. Chcemy, żeby to nie był tylko slogan, ponieważ staramy się słuchać potrzeb i opinii naszych Klientów.

W tej wersji rozpoczynamy obsługę "słowa klucza" (słowa aktywującego mikrofon) oraz wprowadzamy bardziej zaawansowaną obsługę odtwarzaczy dodanych do Asystenta domowego.

Wykrywanie słowa kluczowego

Wprowadzamy (na początek do naszej aplikacji na system Android a docelowo do wszystkich naszych aplikacji), możliwość włączenia wykrywania słowa kluczowego - mechanizm wyzwalający rejestrowanie polecenia głosowego.

Po testach zdecydowaliśmy się zastosować bardzo dokładny i lekki silnik aktywujący Porcupine. O wyborze tego rozwiązania zadecydowały jego cechy:

  • Użycie do trenowania głębokich sieci neuronowych przeszkolonych w rzeczywistych sytuacjach.
  • Kompaktowy i wydajny. Może pracować z tak małą jak 20 KB RAM.
  • Międzyplatformowy. Jest zaimplementowany w ANSI C. Producent wspiera wiele platform: Raspberry Pi, Beagle Bone, Android, iOS, watchOS, Linux (x86_64), Mac, Windows, WebAssembly.
  • Skalowalny. Może wykrywać wiele poleceń głosowych jednocześnie bez dodatkowego obciążenia procesora / pamięci.
  • Częściowo otwarty - mamy do dyspozycji zestaw predefiniowanych "wyrażeń aktywujących" na różne platformy za darmo.

To jest nasza aplikacja testowa do wykrywania słów aktywujących komendę, która działa na urządzeniach z Androidem.

https://github.com/sviete/AIS-hotword

Rozwiązanie to na początku jest wbudowane w naszą aplikację dostępną w Google Play. Aktywacja mikrofonu będzie wymagała świadomego włączenia przez użytkownika. O tym, że mikrofon jest włączony, informujemy stosownym powiadomieniem. Rozwiązanie jest 100% offline - działa bez połączenia z Internetem - słuchamy Cię, ale nie podsłuchujemy!

Na początek dostarczymy kilka słów aktywujących do wyboru, są to wytrenowane zwroty dostępne na licencji Apache License 2.0, dzięki czemu możemy ich użyć w naszym projekcie.

Umożliwimy też dostosowanie czułości nasłuchiwania do własnych potrzeb.

Ta funkcjonalność w połączeniu z odtwarzaczem i rozkładem pomieszczeń (floor plan) pozwoli na łatwe zbudowanie panelu do sterowania naszym domem - wystarczy na tablecie zainstalować naszą darmową aplikację :)

AI-Speaker

Docelowo mamy ambicję, by zastosować własne słowo aktywujące, które będzie kojarzone z naszą marką. Z tego, co się orientujemy, będzie to pierwszy tego typu projekt w Polsce, który zajmie trochę czasu i zasobów. Na tą chwilę nie podajemy terminów.

Więcej szczegółów jak to działa w dokumentacji Dotykowy panel sterowania

Przekierowanie mediów

Odtwarzacze

Dodaliśmy możliwość bardziej zaawansowanej obsługi odtwarzaczy. Poza wbudowanym odtwarzaczem mediów, który dostarczamy na urządzeniu (wraz ze skonfigurowanymi serwisami dostarczającymi media do odtwarzania) mamy teraz możliwość:

  • przekierowania mediów na inne odtwarzacze:

Przekierowanie mediów

  • grupowanie odtwarzaczy:

Grupowanie odtwarzaczy

  • wysyłanie tekstu do przeczytania na grupę głośników (tylko jeżeli głośnik posiada mechanizm TTS)

Wysyłanie tekstu na grupę głośników

Więcej szczegółów jak to działa w dokumentacji Odtwarzacze

Dodatkowo telefon/tablet/TvBox z systemem Android może być teraz też odtwarzaczem, możesz też wysyłać do niego powiadomienia głosowe. Wystarczy zainstalować naszą darmową aplikację. Z aplikacji możesz też teraz łatwo sterować mediami na bramce z innego urządzenia (telefonu).

AI-Speaker

Sterowanie mediami na bramce z telefonu

Więcej szczegółów jak to działa w dokumentacji Sterowanie mediami na bramce z telefonu

Nowa wersja naszej aplikacji na zegarki z WearOS

Zmieniliśmy sposób komunikacji z bramką, dzięki czemu otrzymujemy powiadomienia głosowe/tekstowe o wykonaniu akcji nie tylko na bramce, ale też na kliencie, który wysyła komendę. W skrócie wygląda to teraz tak:

Zigbee2MQTT

Łatwiejsza zmiana nazwy urządzenia- wystarczy kliknąć węzeł urządzenia na mapie, aktualna nazwa zostanie automatycznie wpisana do formularza zmiany nazwy.

Generowanie stylów CSS dla kart (floor plan)

Docelowo planujemy zrobić to bardziej na zasadzie "drag & drop", tak żeby każdy mógł rozmieścić swoje urządzenia na planie i nimi sterować. Można zapoznać się ze zarysem funkcjonalności zaprezentowanej na forum: https://ai-speaker.discourse.group/t/rzut-podlogi-floor-plan/155

Floor plan

Home Assistant

Najnowszy (stabilny) Home Assistant

Bardzo podoba nam się ulepszona obsługa encji i możliwość usuwania niedostępnych pozycji bezpośrednio z interfejsu użytkownika.

Asystent


Zapraszamy do aktualizacji i komentowania na forum AI-Speaker 02/2020