Temat: Jak wykorzystać zasoby Runetu w pracy z tekstem
  • W jaki sposób zorganizowana jest przestrzeń Runetu, jaki jest jego zasięg
  • Dekodery, deszyfratory, konwertery cyrylicy
  • Morfologiczna analiza słów
  • Oznaczanie akcentu wyrazowego
  • Dzielenie wyrazów na sylaby w języku rosyjskim
  • Syntezatory mowy - ich zastosowanie
  • Konwersja mowy na tekst
  • Badanie tendów językowych w języku polskim i rosyjskim

Hasło "Wasze Internety", które jakiś czas temu podbiło media elektroniczne oprócz tego, że spowodowało wypływ tysięcy memów z liczbą mnogą rzeczownika internet, u osób zajmujących się lingwistyką nie wywołało szoku. Dlaczego? Gdyż lingwiści od dawna zajmują się tak zwanymi internetami lokalnymi (polski internet, niemiecki internet, chiński internet itd.). Szczególnie mocno odrębność językową w sieci globalnej prezentują Rosjanie, którzy posiadają Runet.

Słowo Runet jest oficjalnie używanym określeniem rosyjskojęzycznego segmentu globalnej sieci. Od roku 2005 funkcjonuje ono w słownikach ortograficznych. Słownik encyklopedyczny (2009) podaje, że „początkowo Runet był częścią Internetu należąca do domeny narodowej, obecnie to segment Internetu, łączący wszystkich rosyjskojęzycznych użytkowników sieci, z zastrzeżeniem, że należą do nich nie tylko mieszkańcy krajów byłego ZSRR” (Энциклопедический словарь, 2000-2014).

Runet i jego zasięg

Runet jest nazwą Internetu w krajach rosyjskojęzycznych lub krajach, gdzie język rosyjski jest jednym z oficjalnych języków: Rosji, Białorusi, Ukrainie, Armenii, Tadżykistanie, Azerbejdżanie, Gruzji, Kirgistanie, Kazachstanie, Mołdawii i Uzbekistanie. Należy wskazać, że każde z wymienionych państw posiada osobną strefę domen (np., .am, .az, .by, .ge, .kg, .kz, .md, .ru, .рф, .su, .tj, .ua, uz.) i język państwowy, ale ich granice w globalnej sieci są rozmyte. Internety narodowe takie jak Bynet (segment Internetu białoruskiego), Kaznet (segment Internetu kazachskiego), Tatnet (segment Internetu tatarskiego), czy Uznet (segment Internetu uzbeckiego) są częścią Runetu ze względu na obywającą się w ich ramach komunikację w języku rosyjskim, którym posługują się zarówno twórcy i odbiorcy internetowi.

W listopadzie 2009 roku grupa analityczna największej rosyjskiej wyszukiwarki „Yandex” opublikowała wyniki badania „Zawartość Runetu” (Контент Рунета 2009) w którym podaje, że segment rosyjskiego Internetu zajmuje 6,5% wszystkich stron internetowych na świecie, to znaczy, że co piętnasta strona w sieci jest stroną rosyjskojęzyczną.

Badania przeprowadzone w marcu 2013 roku przez Web Technology Surveys W3Techs (W3Techs 2013) pokazały, że 5,9 % stron internetowych w sieci globalnej należało do domen Runetu, co oznacza, że w roku 2013 język rosyjski wysunął się na drugą pozycję wśród języków używanych w Internecie. Самые популярные языки Интернетa →

Wiadomo, że globalny internet jest oceanem plików, chaosem, metodycznie niezorganizowaną przestrzenią. W Runecie już dziś zauważalne jest, że, na przykład, znakomita większość projektów związanych z nauką, kształceniem w zakresie języka rosyjskiego na wszystkich poziomach jest w fazie łączenia się w projekty globalne. Oznacza to, że ta część Runetu w niedalekiej przyszłości zostanie prawdopodobnie uporządkowana, co doprowadzi do stworzenia w nim oddzielnego segmentu, może nawet specjalnej domeny dla sfery naukowo-edukacyjnej.

Morfologiczna analiza słów:

Runet pozwala nam przy pracy z dużym masywem informacji na automatyczne określanie części mowy, wskazuje nam deklinację, daje przykłady użycia, pokazuje akcet wyrazowy, na przykład:

Dzielenie wyrazów na sylaby w języku rosyjskim

Prace nad udogodnieniami w sferze językowej trwają. Powstały wirtualne systemy pozwaljące dzielić słowa na sylaby.

  1. slogi.su
  2. syllables.ru

Oznaczanie akcentu wyrazowego

Zadanie 1

Oznacz akcent wyrazowy na tekście za pomocą MORFERA, skoryguj podane przez program warianty (można przez udarenie.ru).

Кукушка перекладывает на приемных родителей все издержки по выращиванию потомства: постройку гнезда, насиживание птенцов, добычу для них пищи. Это позволяет самке откладывать до 15 яиц в сезон, что невозможно при «обычном» гнездовании. Ее организм не способен сформировать несколько яиц одновременно, а если производить их одно за другим, то после вылупления первых птенцов кукушка не сможет кормить их, поскольку должна будет насиживать оставшиеся яйца. Кроме того, вырастить 15 кукушат даже пара птиц не в состоянии. Подбрасывание яиц выгодно для размножения, и эта повадка эволюционно закрепилась у кукушек, а также у некоторых других птиц — райских вдовушек, например.

Dekodery, deszyfratory, konwertery cyrylicy

Rosyjski internet rozwija się bardzo dynamicznie, często powstają w nim projekty niespotykane w innych internetach. Na przykład, dekodery cyrylicy. Zdarza się, że otrzymujemy tekst, którego nie możemy odczytać, bo zamiast tekstu mamy dziwne znaczki.

Zadanie 2. Rozkoduj ten tekst: skopiuj do okna dekodera i naciśnij "rozszyfrować".

добрый вечер,
меня зовут Даниэл, я живу в Гдыне! Ваш Гданьск далеко, потому что давай писать майлы!
Когда мы можем разговоривать в чат?

Zadanie 3

Ciekawostka z polskiego segmentu internetu - Transliteracja →

Za pomocą narzędzia transliteracja spróbuj zamienić zdanie "Чайковский: психологический «портрет» русского композитора" [Transliteracja cyrylicy według zasad międzynarodowego standardu ISO 9:1995 – oficjalnie przyjętego także przez Polskę, jako PN-ISO 9:2000] - wybierz z rozwijanej listy

i kolejna transliteracja, tym razem na język angielski- http://translate.meta.ua/translit/

Syntezatory mowy - ich zastosowanie

Jako pierwszy przykład syntezatora mowy można podać znany wszystkim system GPS, który nakierowuje nas na obiekt, do którego chcemy dotrzeć.

Przekształcanie tekstu pisanego w zwerbalizowany (mowę) to również zadanie dla lingwistów. Lingwistyka, akustyka, inżynieria, informatyka - połączyły swoje siły, aby w internecie mogły funkcjonować osoby ociemniałe - niedowidzące i niewidzące. Powstają syntezatory mowy, które umożliwiają odczytanie tekstu. Polski syntezator mowy (lektor Iwona) okazał najlepszy na świecie. Jeszcze parę lat temu w wersji testowej odczytywał wiadomości na interia.pl i onecie.pl. Sukces trójmiejskiej firmy polega na tym, że opracowany produkt został sprzedany Amazon https://www.ivona.com/pl/o-firmie/portfolio-glosow/. Obecnie można lektora Iwonę zakupić.

 

Rozbiór zdania (składnia/синтаксис)

Текстовод >

Wpisz zdanie i scharakteryzuj otrzymane dane. 

Мия приняла душ, переоделась, ведь в платье ей было совсем неудобно. Привела себя в порядок. Ей как раз хватило часа.

Jakie inne możliwości dla analizy słów i tekstów posiada narzędzie Текстовод > ?

 

Istnieją syntezatory online, które pozwalają na odczytanie krótkich fraz:

Zadanie 4 - Testujemy możliwości syntezatora mowy:

Чтобы перевести текст в речь онлайн можно воспользоваться синтезатором речи. Он работает по принципу конвертации текста в аудиофайл формата mp3.

Konwersja mowy na tekst

Jeżeli można już zamienić tekst w głos, to powinno to działać w drugą stronę. Lingwiści biorą także udział w pracach na tworzeniem internetu rzeczy. Dziś możemy za pomocą telefonu (apek i sieci) ustawić sobie na konkretną godzinę np. opuszczanie żaluzji, czy rozmrażanie lodówki. Możemy tego dokonywac również za pomocą syntezatorów mowy.

Kto korzysta z Siri? [Siri – inteligentny osobisty asystent i nawigator wiedzy, który działa na systemie operacyjnym Apple iOS i MacOS Sierra. Aplikacja odpowiada na pytania i zalecenia oraz wykonuje działania poprzez przekazanie żądania do mikrofonu]. - Pani pokaże jak to działa na swoim komputerze z Wordem.

Ja też chcę:

Badanie tendów językowych w języku polskim i rosyjskim

Google.com, oprócz tego, że daje wyszukiwarkę tworzy komplet narzędzi online. Możemy korzystać ze zintegrowanych w naszym koncie - worda, exela, tworzyć ankiety, posiadać dysk wirtualny, pocztę i inne. Wśród ogólnodostępnych narzędzi znajduje się także instrument do badanie tendów językowych: https://trends.google.com/trends/→ (boczne menu - prawa, lewa do ustawiania języków).

Zadanie 5

Sprawdzamy dynamikę słów: ros. майнкрафт, bambik, selfi, как уехать из России i in.

Bibliografia: