Prototypowy system INIA (Integrated Non-Invasive Analyzer), którego nazwę twórcy wzięli od jednego z gatunków delfina rzecznego posługującego się echolokacją, jest zintegrowanym, nieinwazyjnym analizatorem mowy. System oparty jest na urządzeniu INIA Array. Wykorzystuje on kołową macierz mikrofonowej oraz algorytmy cyfrowego kształtowania wiązki akustycznej do precyzyjnej analizy rozkładu natężenia dźwięku na twarzy badanej osoby.
System rozwijany jest w ramach projektu naukowo-badawczego OPUS nr 2021/43/HS200162 – Badanie mowy zaburzonej i funkcji prymarnych za pomocą artykulografu CARSTENS AG501 i analizatora rozkładu pola akustycznego – finansowanego przez Narodowe Centrum Nauki. Kierownikiem projektu jest dr hab. Anita Lorenc, prof. Uniwersytetu Warszawskiego (Pracownia Fonetyki Stosowanej im. Marii Przybysz-Piwko, Instytut Polonistyki Stosowanej). Wykonawcami projektu są naukowcy Akademii Tarnowskiej współpracujący z fonetykami z Uniwersytetu Adama Mickiewicza w Poznaniu oraz logopedami pracującymi w Laboratorium Mowy Agnieszki Borowiec w Warszawie.
Projekt systemu oraz implementację oprogramowania (procesora INIA Array i aplikacji INIA Fusion) opracował dr inż. Daniel Król, prof. Akademii Tarnowskiej. Natomiast projektem obwodów drukowanych oraz modelowaniem 3D elementów mechanicznych zajął się inż. Bartosz Srebro, również pracownik AT.
Jest to jedyny na świecie tak dokładny system umożliwiający przeprowadzenie m.in. zaawansowanych analiz przestrzennego rozkładu pola akustycznego związanych z diagnostyką i terapią wad wymowy takich, jak wymowa boczna, czy niepożądana nazalizacja. Uzyskiwana rozdzielczość przestrzenna rozkładów pola akustycznego wynosi mniej niż 1 mm. System może wnieść zupełnie nową jakość do badań pacjentów z rozszczepem podniebienia, czy niewydolnością podniebienno-gardłową, u których obecnie wykorzystuje się znacznie mniej dokładną i inwazyjną nasometrię – mówi dr inż. Daniel Król, prof. Uczelni.
Warto wspomnieć, że obecna wersja zintegrowanego systemu diagnostycznego powstała na bazie doświadczeń uzyskanych przez dra. inż. Daniela Króla, prof. Uczelni. podczas realizacji projektu Sonata Bis nr 2012/05/E/HS2/03770 pt. Współczesna wymowa polska. Badanie z wykorzystaniem trójwymiarowej artykulografii elektromagnetycznej, sfinansowanego przez Narodowe Centrum Nauki i zrealizowanego pod kierownictwem dr hab. Anity Lorenc prof. Uniwersytetu Warszawskiego. Za uzyskane wyniki wykładowca Katedry Informatyki został laureatem nagrody Pionier Innowacji w konkursie Tarnowska Innowacja 2016. Nominowano go także do tytułu Ambasadora Nauki Polskiej w plebiscycie organizowanym przez KGHM Polska Miedź S.A. w 2019 r.
W obecnym systemie INIA zastosowano algorytmy cyfrowego kształtowania wiązki (Beamforming) na „surowym” sygnale PDM (Pulse Density Modulation) z oraz zaawansowane algorytmy przetwarzania końcowego (post-processing), co umożliwiło osiągnięcie bardzo wysokiej rozdzielczości analizy przestrzennej. Dodatkowo urządzenie zawiera laserowy sensor odległości 3D, dzięki czemu możliwe jest kształtowanie wiązki dokładnie na twarzy pacjenta. Dane z urządzenia INIA Array przysłane są do aplikacji INIA Fusion, gdzie można dokonywać zaawansowanych analiz czasowych, częstotliwościowych i przestrzennych.
Jednym z założeń stworzonego systemu było maksymalne uproszczenie urządzenia do akwizycji danych pomiarowych i przeniesienie złożonych obliczeń do aplikacji. Dzięki temu zwiększyliśmy skalowalność systemu przy jednoczesnym obniżeniu jego kosztów – tłumaczy prof. Daniel Król.
Do akwizycji danych audio wykorzystuje się urządzenie INIA Array, zbudowane z wykorzystaniem kołowej macierzy mikrofonowej. Sercem przyrządu jest nowoczesny procesor dedykowany do przetwarzania sygnałów z rdzeniem ARM Cortex-M33. Urządzenie, dodatkowo zawiera zintegrowany laserowy, wielostrefowy sensor odległości wykorzystujący technikę ToF (Timer of Flight).
Wbudowanie czujnika odległości umożliwia precyzyjne ogniskowanie wiązki akustycznej dokładnie na twarzy pacjenta. Co istotne: laser czujnika spełnia wymagania klasy 1, więc jest całkowicie bezpieczny dla wzroku. Dane audio oraz trójwymiarowe obrazy z czujnika ToF przesyłane są za pomocą interfejsu USB do aplikacji INIA Fusion.
Po zakończeniu badań planowane jest wprowadzenie systemu na rynek. Chęć współpracy wyraził już CEO amerykańskiej firmy LAC Technologies Łukasz Cichocki, który, notabene, ukończył informatykę w Akademii Tarnowskiej i współtworzył Inkubator Innowacji działający przy Katedrze Informatyki AT.
Na bogatym doświadczeniu zdobywanym przez naukowców Akademii Tarnowskiej skorzystają studenci. U boku kadry opracowującej innowacyjne rozwiązania technologiczne nauczą się więcej niż wynikałoby to z programów studiów. Kolejny raz przekonujemy się, że hasło Katedry Informatyki – uczymy implementować przyszłość – nie jest wyłącznie chwytliwym sloganem.
Przykładowy wykres przestrzenny słowa LASAMI:
Od góry: oscylogram, przekrój poziomy, przekrój pionowy.