FU-Lab. 2024.10.07.-2024.10.11

опубликовал Öньö Лав в 11:33 11.10.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.10.07.-2024.10.11.

  1.  
  2. Завершение распознавания и вычитки в программе ABBYY FineReader, проверка орфографии, обработка в программе LibreOffice Writer русскоязычного текста учебника "М. Я. Цузмер. «Зоология" (1936) в целях его дальнейшего выравнивания с коми переводом для параллельного корпуса коми языка.
  3. Сбор переводных текстов нормативно-правовых актов БОП на коми языке за 2023 год, создание метаразметок и подготовка текстов для корпуса коми языка.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №41); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Создание фотокопий статей номеров газеты "Югыд туй" за октябрь-ноябрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№111-121 и их обработка в программе LibreOffice Writer.
  6. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  7. Разбивка pdf файлов сборников "Пермистика" на отдельные файлы статей и их обработка для загрузки на сайт "Пермистика".
  8. Создание унифицированного списка статей сборников "Пермистика" для возможности автоматической загрузки.
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.30.-2024.10.04

опубликовал Öньö Лав в 19:27 03.10.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.30.-2024.10.04.

  1.  
  2. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) русскоязычных текстов изданий "Б. Всесвятский. Ботаника" (1936), "А. Н. Кабанов. Анатомия" (1937).
  3. Распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания "М. Я. Цузмер. Зоология" (1936).
  4. Продолжение перевода с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 3.07.2024 и редактирование коми текстов для включения в базу переводчика.
  5. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №40); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  7. Разработка сайта "Пермистика" с функцией поиска по различным критериям и возможностью добавления pdf статей.
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.23.-2024.09.27

опубликовал Öньö Лав в 11:59 27.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.23.-2024.09.27.

  1.  
  2. Приобретение, сканирование и обработка в программе ABBYY FineReader, создание pdf копий русскоязычных учебников, имеющих коми переводы: "Б. Всесвятский. Ботаника" (1934), "Б. Всесвятский. Ботаника" (1936), "М. Я. Цузмер. Зоология" (1936), "А. Н. Кабанов. Анатомия" (1937).
  3. Завершение распознавания и вычитки в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов) текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).
  4. Распознавание и вычитка в программе ABBYY FineReader русскоязычных текстов изданий "Б. Всесвятский. Ботаника" (1934), "Б. Всесвятский. Ботаника" (1936), "А. Н. Кабанов. Анатомия" (1937).
  5. Конвертация текста коми-пермяцкого издания на латинице "В. V. Vşesvjatskij. Вotaꞑika." (1934) на современную графику, его обработка в программе LibreOffice Writer и приведение к нормам современной орфографии.
  6. Обработка в программе LibreOffice Writer русскоязычного текста издания "Б. Всесвятский. Ботаника" (1934) и его выравнивание по предложениям в программе WinMerge с коми, коми-пермяцким и удмуртским переводами.
  7. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта komiinform.ru за 3.07.2024 и редактирование коми текстов для включения в базу переводчика.
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №39); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Продолжение унификации орфографии и модернизации терминологии в датасете для нейросети.
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ воысь куим квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 18:33 26.09.2024

2023-12-25–2004-09-20.

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Приобретение, сканирование и обработка в программе ABBYY FineReader, создание pdf копий 41 русскоязычных издания, с которых были сделаны коми переводы: "Б. В. Всесвятский. Ботаника" (1957), "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957), "М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953), "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Русские богатыри" (1951), "Г. Кржижановский. Великий Ленин" (1956), "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Герман. Рассказы о Дзержинском" (1952),   "В. Гюго. Девяносто третий" (1937).

2.2. Поиск в сети Интернет и сбор текстов русскоязычных оригиналов 42 комиязычных изданий: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Валентин Катаев. Полклӧн пи" (1947), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Сталин йылысь висьтъяс" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), а также 12 pdf-копий русскоязычных оригиналов коми изданий:  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "Ф. Гладков. Клятва" (1947).

2.3. Распознавание и вычитка в программе ABBYY Fine Reader текстов 52 русскоязычных изданий, имеющих коми эквиваленты: "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947), "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940), "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951), "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952), "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945), "Г. Кржижановский. Великий Ленин" (1956), "М. Я. Цузмер. Зоология" (1933), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956);  обработка данных текстов в программе LibreOffice Writer.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текстов 101 переводного издания: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "А. Додэ. Тарасконса Тартарен" (1940), "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941), "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Валентин Катаев. Полклӧн пи" (1947), "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955), "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948), "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947), "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937).

2.5. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.

2.6. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.

2.7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
Первичное выравнивание в программе WinMerg комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.

2.8. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь-декабрь 2023 г. и январь-июль 2024 г., их выравнивание по предложениям в программе WinMerge и включение в параллельный корпус.

2.9. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.

2.10. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.

2.11. Перевод на коми язык с помощью телеграм-бота новостных текстов за 23-25.01 и 2-3.07.2024 c сайта bnkomi.ru,  за 11-15.01 и 3.07.2024 c сайта komiinform.ru; редактирование коми текстов и выравнивание коми и русских текстов в программе WinMerge для включения в  базу переводчика.

2.12. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) и текста издания: "А. Шебырев. Фараон" (2019) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика. 

2.13. Подбор и распределение материала для перевода на коми язык из массива корпуса текстов, предоставленных МКАO «Яндекс»; восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс"; сборка текстов переводов, сделанных для МКАО "Яндекс".

2.14. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках; терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.

2.15. Первичное развертывание и настройка нейронной библиотеки  глубокого машинного обучения openNMT.

2.16. Проведение работ по обучению модели русско-коми переводчика на  основе нейронных сетей (библиотека Sockeye), обучено 15  экспериментальных моделей.

2.17. Создание бота для автоматизации запросов к переводчику.

2.18. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

2.19. Исправление метаразметки в параллельном корпусе.

2.20. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

Объём русско-коми параллельного корпуса за отчетный период возрос на 306 859 единиц и к 2024-09-20 составляет 1 719 687 выравненных предложений (с повторами).

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий 94 комиязычный изданий: "О. Шлопова. Туръяса мойдъяс да висьтъяс", "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "Дм. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Шӧр нэмъяслӧн история" (1941), "Е. А. Косминский. Средньӧй векъяслӧн история" (1951), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Оласӧ да вӧласӧ" (1991), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022),  "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов 121 переводных изданий: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история" (1941), "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957), "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов. Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948), "Али-Баба да нелямын разбойник" (1950), "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), "Ю. Ермолаев. Гажа висьтъяс" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); "Г. Ивкучева. Борд пӧла каля" (2022), "В. Лодыгин. Габовсаяс" (2015); обработка распознанных текстов в программе LibreOffice Writer.

3.3. Создание фотокопий статей номеров газеты "Югыд туй" за июль-сентябрь 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№79-110 и их обработка в программе LibreOffice Writer.

3.4. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.

3.5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52; 2024. №№1-38), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №№1-6) и "Войвыв кодзув" (2023 №№11-12; 2024 №1-4), а также  номеров газеты "Выль туйӧд" (2021. №№ 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №№ 1-10, 12-16, 18, 20-27, 28, 31, 33, 34, 42-49, 50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 3 285 176 единицы и к 2024-00-20 составляет 85 029 389 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 9 комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937), "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

4.2. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937).

4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1925. №№ 25-37; 1926 №№ 1-12), газеты "Југыԁ туј" (1925. №№ 210, 213, 215, 219, 226, 228, 232, 237, 241, 246, 251; 1926. №№ 19, 20) и журнала "Комі му" (1924. №№ 3, 4-6, 7-10; 1925 №№ 3-4, 5, 6-7, 8, 9, 10-11, 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).

4.4. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.

Объём молодцовского корпуса за отчетный период возрос на 91 140 единиц и к 2024-09-20 составляет 2 725 274 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 21 номеров газеты "Комі ԍікт" и 15 номеров газеты "Југыԁ туј" за 1925-1926 гг., а также коми текстов 10 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на  893 единицы и к 2024-06-21 составляет 17 677 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по 123 книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)", "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939), "Би (А. Барбюс, 1941ʼ вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", "Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг)", "Ботаника (1952ʼ вося небӧг)", "Гажа мойдъяс (1948ʼ вося небӧг)", "География (4-ӧд класслы 1956ʼ вося небӧг)"‎‎, "География кузя лыддьысян книга (1957ʼ вося небӧг)", "Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг)", "Зоология (1952ʼ вося небӧг)"‎‎, "Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг)", "Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг)", "Руч да кӧч (1959ʼ вося небӧг)", "Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг)", "СССР-лӧн география (1957ʼ вося небӧг)", "СССР-лӧн история (1963ʼ вося небӧг)"‎‎, "Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг)", "Тема да Жучка (1954ʼ вося небӧг)", "Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг)", "Январь 9-ӧд лун (М. Горький, 1958ʼ вося небӧг)", "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)", "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎, "Ванька (1937ʼ вося небӧг)", "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎", "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)",  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)", "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-12, 2024. №№ 1-6).

6.3. Создание и заполнение wiki-страниц с оглавлением по 30 номерам газет "Комі ԍікт" и "Југыԁ туј" за 1925-1926 гг. в онлайн-справочнике "Коми тӧданін".

6.4. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.

6.5. Пополнение страниц авторов и переводчиков ссылками на издания, добавленные за истекший период.

7. Пополнение лексической базы FU-Lab:

7.1. Лингвистическая разметка электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».

7.2. Размещение "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab".

7.3. Техническая разметка "Коми-пермяцко-русского словаря": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции, заполнение транскрипции, оформление отступов.

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.

8.2. Разбивка и первичное выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текста удмуртского издания "Л. Воронкова. Пичи нылъёс школае мыно" (1953) как образец данного вида работы для сектора языка УИИЯЛ УдмФИЦ УрО РАН.

8.3. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.

10. По лингвистическому ресурсу "Коми кыв":

10.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий сборников из серии "Пермистика": "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)","Пермистика XI" (2006), "Пермистика-12" (2008), "Пермистика-13" (2012) "Пермистика XIV" (2012).

10.2. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".

10.3. Работа по технической разметке будущего сайта "Пермистика".

10.4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

11.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

12. Иное

12.1. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.

12.2. Распространение комиязычного контента в соц. сетях.

12.3. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12.4. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.

12.5. Адаптивная HTML-вёрстка новой структуры группы сайтов fu-lab.ru.

13. Участие в мероприятиях и выступления в сми:

13.1. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор", эфир 21.03.2024).

13.2. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).

13.3. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).

13.4. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).

13.5. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).

13.6. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).

13.7. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024) и выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).

13.8. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).

13.9. Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.

2024ʼ воысь коймӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:25 26.09.2024

2024-06-24–2024-09-20.

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копий  русскоязычных изданий: "Русские богатыри" (1951), "Г. Кржижановский. Великий Ленин" (1956), "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Герман. Рассказы о Дзержинском" (1952),   "В. Гюго. Девяносто третий" (1937).

2.2. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий: "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952), русскоязычных изданий "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945), "Г. Кржижановский. Великий Ленин" (1956), "М. Я. Цузмер. Зоология" (1933);  обработка данных текстов в программе LibreOffice Writer.

2.3. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948), "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947), "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937).

2.4. Перевод на коми язык с помощью телеграм-бота новостных текстов за 2-3.07.2024 c сайта bnkomi.ru,  за 3.07.2024 c сайта komiinform.ru  и редактирование коми текстов для включения в базу переводчика.

2.5. Сборка текстов новостной ленты официального портала РК за январь-июль 2024 г. и выравнивание данных текстов на коми и русском языках в программе WinMerge.

2.6. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).

2.7. Восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс".

2.8. Распределение дополнительного материала для перевода текстов, предоставленных компанией "Яндекс".

2.9. Сборка текстов переводов, сделанных для МКАО "Яндекс".

2.10. Работа по унификации лексики и орфографии в текстах для переводчика.

2.11. Терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.

Объём параллельного корпуса коми языка за отчетный период возрос на 55 329 единиц и к 2024-09-20 составляет 1 719 687​ выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Оласӧ да вӧласӧ" (1991), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022),  "В. Лодыгин. Габовсаяс" (2015).

3.2. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), "Ю. Ермолаев. Гажа висьтъяс" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); "Г. Ивкучева. Борд пӧла каля" (2022), "В. Лодыгин. Габовсаяс" (2015); обработка распознанных текстов в программе LibreOffice Writer.

3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№25-38), журналов "Йӧлӧга (2024. №№5, 6) и "Войвыв кодзув" (2024. №№2-4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.4. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№89-110 и их обработка в программе LibreOffice Writer.

Объём корпуса коми языка за отчетный период возрос на 551 793 единицы и к 2024-09-20 составляет 85 029 389 словоупотреблений.

4. Текстовое пополнение молодцовского и латинского корпуса: 

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№9, 10, 11, 12), журнала "Комі му" (1924. №№7-10, 1925 №№10-11, 12),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по номерам газеты в онлайн-справочнике "Коми тӧданін".

4.2. Распознавание и вычитка в программе ABBYY FineReader текстов коми изданий на молодцовице: "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); обработка распознанных текстов в программе LibreOffice Writer.

4.3. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 4 номеров газеты "Комі ԍікт" за 1926, а также коми текстов 3 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на 210 единиц и к 2024-09-20 составляет 17 677 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін": 

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)",  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)", "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024. №№ 4-6).

7. Пополнение лексической базы FU-Lab:

7.1. Завершение  вторичной разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab",

7.2. Размещение "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-Lab";

7.3. Техническая разметка "Коми-пермяцко-русского словаря": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции, заполнение транскрипции, оформление отступов.

8. По лингвистическому ресурсу "Коми кыв":

8.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий сборников из серии "Пермистика": "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)","Пермистика XI" (2006), "Пермистика-12" (2008), "Пермистика-13" (2012) "Пермистика XIV" (2012).

8.2. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".

8.3. Работа по технической разметке будущего сайта "Пермистика".

8.4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

9.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Участие в мероприятиях:

12.1 Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.
 

2024ʼ кӧч тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 12:32 23.09.2024

2024-08-26–2024-09-20.

  1.  
  2. Распознавание и вычитка в программе ABBYY FineReader текста учебника М. Я. Цузмера "Зоология" (1933) на русском языке, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с переводами на коми, коми-пермяцкий и удмуртский языки.
  3. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).
  4. Сканирование и распознавание в программе ABBYY FineReader текста комиязычного издания "В. Лодыгин. Габовсаяс" (2015).
  5. Cканирование, распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания "Г. Кржижановский. Великий Ленин" (1956), проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с коми переводом.
  6. Сборка текстов новостной ленты официального портала РК на русском языке за январь-июль 2024 г. и выравнивание данных текстов на коми и русском языках в программе WinMerge.
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№34-38), журнала "Войвыв кодзув" (2024. №№3, 4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№105-110 и их обработка в программе LibreOffice Writer.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов  журнала "Комі му" (1924. №№7-10),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  11. Перевод на коми язык с помощью телеграм-бота новостных текстов за 2-3.07.2024 c сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  12. Перевод на коми язык с помощью телеграм-бота новостных текстов за 3.07.2024 c сайта komiinform.ru и редактирование коми текстов для включения в базу переводчика.
  13. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  14. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)", "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".
  15. Сборка текстов переводов, сделанных для МКАО "Яндекс".
  16. Работа по унификации лексики и орфографии в текстах для переводчика.
  17. Редактирование разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab": заполнение транскрипции, оформление отступов.
  18. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий изданий: "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика XI" (2006). "Пермистика XIV" (2012).
  19. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".
  20. Работа по созданию сайта "Пермистика".
  21. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  22. Распространение комиязычного контента в соц. сетях.
  23. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.16.-2024.09.20

опубликовал Öньö Лав в 12:00 20.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.16.-2024.09.20.

  1.  
  2. Завершение перевода с помощью телеграм-бота на коми язык новостных текстов за 2-3.07.2024 c сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  3. Перевод с помощью телеграм-бота на коми язык новостных текстов за 3.07.2024 c сайта komiinform.ru и редактирование коми текстов для включения в базу переводчика.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2024. №38); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Завершение выравнивания текстов новостной ленты официального портала РК на коми и русском языках за январь 2024 г. - июль 2024 г. в программе WinMerge.
  6. Сканирование в программе ABBYY FineReader книги В. Лодыгина "Габовсаяс" (2015) на коми языке и создание электронной копии в формате pdf.
  7. Распоознавание и вычитка в программе ABBYY FineReader книги В. Лодыгина "Габовсаяс" (Сыктывкар, 2015) на коми языке.
  8. Продолжение сборки текстов переводов, сделанных для МКАО "Яндекс".
  9. Работа по унификации лексики и орфографии в текстах для переводчика.
  10. Работа по созданию сайта "Пермистика".
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.09.-2024.09.13

опубликовал Öньö Лав в 11:57 13.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.09.-2024.09.13.

  1.  
  2. Завершение распознавания и вычитка в программе ABBYY FineReader текста учебника М. Я. Цузмера "Зоология" (1933) на русском языке, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с переводами на коми, коми-пермяцкий и удмуртский языки.
  3. Прирбретение, сканирование, распознавание и вычитка в программе ABBYY FineReader текста книги Г. Кржижановского "Великий Ленин" (1956) на русском языке, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для последующего выравнивания с коми переводом.
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№36,37); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№105-110 и их обработка в программе LibreOffice Writer.
  6. Сборка текстов новостной ленты официального портала РК на русском языке за январь 2024г. - июль 2024г.
  7. Выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь 2024г. - июль 2024г. в программе WinMerge.
  8. Продолжение перевода с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  9. Предварительная сборка текстов переводов, сделанных для МКАО "Яндекс".
  10. Работа по унификации лексики и орфографии в текстах для переводчика.
  11. Продолжение распознавания и вычитки в программе ABBYY FineReader текста коми-пермяцкого издания на латинице: "M. J. Cuzmer. Zoologia" (1934).
  12. Создание общего указателя по сборникам "Пермистика" на сайте "Коми лингвистика".
  13. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Габовсаяс (В. Лодыгинлӧн 2015ʼ вося небӧг)".
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.09.02.-2024.09.06.

опубликовал Öньö Лав в 22:01 05.09.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.09.02.-2024.09.06.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий изданий: "Пермистика" (1987), "Пермистика 2" (1991), "Пермистика XI" (2006). "Пермистика XIV" (2012).
  3. Продолжение перевода с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  4. Начало распознавания в программе ABBYY FineReader текста учебника "М. Я. Цузмер. Зоология" (1933) на русском языке.
  5. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Работа по унификации лексики и орфографии в текстах для переводчика.
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.08.26.-2024.08.30.

опубликовал Öньö Лав в 16:49 29.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.26.-2024.08.30.

  1.  
  2. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№34, 35), журнала "Войвыв кодзув" (2024. №№3, 4); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  3. Завершение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  4. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Ми мунам зоопаркӧ (А. Попов, 2023' вося небӧг)", "Рытъя кыаӧй менам... (Е. Козловалӧн 2023ʼ  вося небӧг)", "Коми войтырлӧн шусьӧгъяс да кывйӧзъяс (2023' вося небӧг)",  "Еджыд эрдъяса му вылын (2023' вося небӧг)", "Морт олӧм (А. Ельцовалӧн 2023ʼ вося небӧг)";
  5. Перевод на коми язык с помощью телеграм-бота новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов  журнала "Комі му" (1924 №№7-10),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  7. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "В. V. Vşesvjatskij. Вotaꞑika." (1934); "M. J. Cuzmer. Zoologia" (1934).
  8. Редактирование разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab": заполнение транскрипции, оформление отступов.
  9. Распространение комиязычного контента в соц. сетях.
2024ʼ моз тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 17:05 21.08.2024

2024-07-22–2024-08-23.

 

  1.  
  2. Приобретение русскоязычного издания "М. Я. Цузмер. Зоология. Учебник для средней школы. 6-7 годы обучения (1933)" в целях дальнейшего распознавания и выравнивания с коми-зырянским, коми-пермяцким и удмуртским переводами.
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии изданий: "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Ермолаев. Гажа висьтъяс" (1963), "Г. Кржижановский. Великӧй Ленин" (1958), "Ю. Герман. Рассказы о Дзержинском" (1952),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "В. Гюго. Девяносто третий" (1937). "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002), "Пермистика-10 (2009)", "Пермистика-12" (2008), "Пермистика-13" (2012).
  4. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "Ю. Ермолаев. Гажа висьтъяс" (1963), "И. Всеволожский. Кӧкъямыс смел будёновец" (1963),  "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "Г. Кржижановский. Великӧй Ленин" (1958); обработка данных текстов в программе LibreOffice Writer.
  5. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий: "С. Ковпак. От Путивля до Карпат" (1970), "Л. Жариков. Повесть о суровом друге" (1952), "В. Гюго. Девяносто третий" (1937), "Ю. Герман. Рассказы о Дзержинском" (1952); обработка данных текстов в программе LibreOffice Writer.
  6. Распознавание и вычитка в программе ABBYY FineReader текстов коми изданий на молодцовице: "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); обработка распознанных текстов в программе LibreOffice Writer.
  7. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "M. J. Cuzmer. Zoologia" (1934).
  8. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947), "В. Гјуго. Ӧкмысԁас којмӧԁ" (1937)
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №11), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№94-104 и их обработка в программе LibreOffice Writer.
  11. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№27-33), журналов "Йӧлӧга (2024. №6) и "Войвыв кодзув" (2024. №2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  12. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке:  "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)", "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)", "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)".
  13. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  14. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь 2024 г. - июль 2024 г.
  15. Терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.
  16. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  17. Распределение дополнительного материала для перевода текстов, предоставленных компанией "Яндекс".
  18. Завершение  вторичной разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab", размещение словаря на сайте; техническая разметка словаря: замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции.
  19. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  20. Распространение комиязычного контента в соц. сетях.
  21. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  22. Продление на годичный срок доменного имени komikyv.org.
FU-Lab. 2024.08.19.-2024.08.23.

опубликовал Öньö Лав в 16:33 21.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.19.-2024.08.23.

  1.  
  2. Приобретение русскоязычного издания "М. Я. Цузмер. Зоология. Учебник для средней школы. 6-7 годы обучения (1933)" в целях дальнейшего распознавания и выравнивания с коми-зырянским, коми-пермяцким и удмуртским переводами.
  3. Распознавание и вычитка в программе ABBYY FineReader текстов коми изданий на молодцовице: "С. М. Горскіј. Пу уҗјас строіԏеԉствоын" (1935), "І. Г. Попов,  Т. Н. Крупеԋенкін, Р. Н. Каԉіԋін. Маԏемаԏіка. ШКМ-ын 1-ја во вылын велӧԁчыԍјаслы уҗалан ԋіга" (1931), "М. Ј. Цузмер. Зоологіја" (1936); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  4. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов коми-пермяцких изданий на латинице:  "Piţu-Əꞑə. Priroda tədmalan kꞑiga. V-əd vo" (1932); "M. J. Cuzmer. Zoologia" (1934).
  5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№32, 33), журналов "Йӧлӧга (2024. №6) и "Войвыв кодзув" (2024. №2); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  7. Терминологическая модернизация текста учебника "И. Н. Шевченко. Арифметика" (1957) для датасета переводчика.
  8. Редактирование разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab": замена тильды на слово, расстановка гиперссылок, добавление строки транскрипции.
  9. Распространение комиязычного контента в соц. сетях.
FU-Lab. 2024.08.12.-2024.08.16.

опубликовал Öньö Лав в 20:16 15.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.12.-2024.08.16.

 

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии издания: "Ю. Герман. Рассказы о Дзержинском" (1952). 
  3. Распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания: "Ю. Герман. Рассказы о Дзержинском" (1952), комиязычного издания "Г. Кржижановский. Великӧй Ленин" (1958); проверка орфографии, обработка распознанного текста в программе LibreOffice Writer для дальнейшего выравнивания с переводным русскоязычным текстом для параллельного корпуса коми языка.
  4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№29, 31); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  5. Сборка и выравнивание текстов новостной ленты официального портала РК на коми и русском языках за январь 2024 г. - июль 2024 г.
  6. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  7. Редактирование "Коми-пермяцко-русского словаря" на сайте "Онлайн-словари FU-lab".
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.08.05.-2024.08.09.

опубликовал Öньö Лав в 20:32 08.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.08.05.-2024.08.09.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии изданий: "Г. Кржижановский. Великӧй Ленин" (1958), "Пермистика-10 (2009)", "Пермистика-12" (2008), "Пермистика-13" (2012).
  3. Распознавание и вычитка в программе ABBYY FineReader текста русскоязычного издания: "В. Гюго. Девяносто третий" (1937); обработка текста в программе LibreOffice Writer и выравнивание по предложениям с текстом коми перевода 1937 года в программе  WinMerge.
  4. Распознавание и вычитка в программе ABBYY FineReader текста комиязычного издания: "Г. Кржижановский. Великӧй Ленин" (1958).
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №28); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Великӧй Ленин (Г. Кржижановскӧй, 1958ʼ вося небӧг)";
  7. Перевод с помощью телеграм-бота на коми язык новостных текстов сайта bnkomi.ru и редактирование коми текстов для включения в базу переводчика.
  8. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  9. Завершение  вторичной разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab", размещение словаря на сайте.
  10. Распределение дополнительного материала для перевода текстов, предоставленных компанией "Яндекс".
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.07.28.-2024.08.02.

опубликовал Öньö Лав в 10:08 02.08.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.07.28.-2024.08.02.

  1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии изданий: "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953), "В. Гюго. Девяносто третий" (1937). "Пермистика-6 (2000)", "Пермистика-7" (1999), "Пермистика-8" (2001), "Пермистика-9" (2002).
  2. Распознавание и вычитка в программе ABBYY FineReader текстов изданий: "Ю. Герман. Дзержинскӧй йылысь рассказъяс" (1953, на коми языке), "Л. Жариков. Повесть о суровом друге" (1952, на русском языке), "В. Гюго. Девяносто третий" (1937, на русском языке); обработка данных текстов в программе LibreOffice Writer.
  3. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Ф. Гладков. Клятва" (1947).
  4. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№102-104 и их обработка в программе LibreOffice Writer.
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №30); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "И жизнь, и слезы, и любовь (А. М. Бушеневалӧн 2021' вося небӧг)", "Вӧрса чай (Л. Палкинлӧн 2021' вося небӧг)", "Дзержинскӧй йылысь рассказъяс (Ю. П. Герман, 1953ʼ вося небӧг)".
  7. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  8. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.07.22.-2024.07.26.

опубликовал Öньö Лав в 21:25 25.07.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.07.22.-2024.07.26.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии изданий: "Л. Жариков. Повесть о суровом друге" (1952), "Ю. Ермолаев. Гажа висьтъяс" (1963).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "Ю. Ермолаев. Гажа висьтъяс" (1963), "И. Всеволожский. Кӧкъямыс смел будёновец" (1963), а также русскоязычного издания "С. Ковпак. От Путивля до Карпат" (1970); обработка данных текстов в программе LibreOffice Writer.
  4. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текста издания: "С. Ковпак. Путивльсянь Карпатыӧдз"  (1953).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №11), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  6. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№94-101 и их обработка в программе LibreOffice Writer.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №27); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжному изданию на коми языке: "Гажа висьтъяс (Ю. Ермолаев, 1963ʼ вося небӧг)". 
  9. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  10. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ сора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 16:10 22.07.2024

2024-06-24–2024-07-21.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии комиязычных изданий: "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Пантелеев Л. Честнӧй кыв" (1947), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "Г. Ивкучева. Борд пӧла каля" (2022), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Оласӧ да вӧласӧ" (1991), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), русскоязычного издания "Русские богатыри" (1951).
  3. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009),  "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".
  4. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947), "СССР-лӧн история. Дженьдӧдӧм курс" (1939), "Г. Ивкучева. Борд пӧла каля" (2022) и "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), русскоязычных изданий "Краткий курс истории СССР" (1937), "Русские богатыри" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945); обработка распознанных текстов в программе LibreOffice Writer.
  5. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№89-93 и их обработка в программе LibreOffice Writer.
  6. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948),  "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939),  "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947).
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №№25, 26) и журнала "Йӧлӧга" (2024. №5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№9, 10), журнала "Комі му" (1925 №№10-11, 12),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по номерам газеты в онлайн-справочнике "Коми тӧданін".
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)", "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)".
  10. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024. №№ 4-6).
  11. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  12. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  13. Восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс".
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.
FU-Lab. 2024.07.15.-2024.07.19.

опубликовал Öньö Лав в 0:45 19.07.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.07.15.-2024.07.19.
          

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии комиязычного издания:  "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий "Пантелеев Л. Честнӧй кыв" (1947), "Игорь Всеволожский. Кӧкъямыс смел будёновец" (1963), русскоязычных изданий "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Гладков. Клятва" (1945).
  4. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990 №№89-93 и их обработка в программе LibreOffice Writer.
  5. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Л. Пантелеев. Честнӧй кыв" (1947).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №10), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Кӧкъямыс смел будёновец (И. Е. Всеволожскӧй, 1963ʼ вося небӧг)".
  8. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  9. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.07.08.-2024.07.12.

опубликовал Öньö Лав в 11:15 12.07.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.07.08.-2024.07.12.
     

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии комиязычных изданий:  "Г. Ивкучева. Борд пӧла каля" (2022), "Ковпак. Путивльсянь Карпатыӧдз" (1953), "Оласӧ да вӧласӧ" (1991).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий "Г. Ивкучева. Борд пӧла каля" (2022) и "А.С.Новиков-Прибой. Цусима. Книга 2" (1935), а также русскоязычного издания "Краткий курс истории СССР" (1937).
  4. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "Роч богатыръяс" (1951), "СССР-лӧн история. Дженьдӧдӧм курс" (1939).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925. №12), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Вокъяс-геройяс (П. Игнатов, 1947ʼ вося небӧг)", "Клятва (Ф. Гладков, 1947ʼ вося небӧг)", "Честнӧй кыв (Л. Пантелеев, 1947ʼ вося небӧг)", "Путивльсянь Карпатыӧдз (С. Ковпак, 1953ʼ вося небӧг)", "Борд пӧла каля (Г. Ивкучевалӧн 2022' вося небӧг)", "Удора-потанӧй (2024ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1949ʼ вося небӧг)", "Тундраса бияс (В. Юхнинлӧн 1951ʼ вося небӧг)", "СССР-лӧн история (1939ʼ вося небӧг)".
  7. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  8. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  9. Распространение комиязычного контента в соц. сетях.
  10. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.07.01.-2024.07.05.

опубликовал Öньö Лав в 19:09 05.07.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.07.01.-2024.07.05.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии комиязычных изданий: "Пантелеев Л. Честнӧй кыв" (1947), "В. Юхнин. Тундраса бияс. Первой часть" (1949), "В. Юхнин. Тундраса бияс. Мӧд часть" (1951), "В. М. Лудыкова. Ӧнія коми кыв. Синтаксис" (2010), русскоязычного издания "Русские богатыри" (1951).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычного издания: "СССР-лӧн история. Дженьдӧдӧм курс" (1939), русскоязычного издания "Русские богатыри" (1951); обработка данных текстов в программе LibreOffice Writer.
  4. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "И. Н. Шевченко. Арифметика" (1957), "Игнатов. Вокъяс-геройяс" (1947), "Гажа мойдъяс" (1948).
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №26); обработка данных текстов в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №9), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  7. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2024. №№ 4-6).
  8. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  9. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.06.24.-2024.06.28.

опубликовал Öньö Лав в 7:11 28.06.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.06.24.-2024.06.28.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копии комиязычного издания: "СССР-лӧн история. Дженьдӧдӧм курс" (1939).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947); обработка распознанных текстов в программе LibreOffice Writer.
  4. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий монографий и учебных пособий д. филол. наук В. М. Лудыковой, предоставленных автором: "Роль прилагательного в формировании смысла высказывания (на материале коми языка)" (2001), "Местоимение и прилагательное в грамматической системе коми и русского языков" (2003), "Адъективное определение в агглютинативных языках (на материале коми языка)" (2008), "Глагол в предложении коми языка" (2012), "Литературный коми язык: история и современное состояние (социолингвистический аспект)" (2014), "Коми кывйысь прöстöй сёрникузя видлалöм : студентъяслы асшöра велöдчöм могысь методическöй индöдъяс" (2007), "Коми кывйын кывтэчас да прöстöй сёрникузя" (2009). Размещение указанных pdf файлов на сервере и создание ссылок на них с сайта "Коми лингвистика".
  5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №25) и журнала "Йӧлӧга" (2024. №5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925 №10-11),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус.
  7. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  8. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн-словари FU-lab".
  9. Восстановление нарушенной структуры текста в файле с переводом одного из сегментов корпуса предложений МКАО "Яндекс".
  10. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  13. Выступление с информацией о работе лаборатории FU-Lab в программе "Ми тані олам" на КРТК "Юрган", эфир 24.06.2024.
2024ʼ во джынся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 12:27 21.06.2024

2. Работа в рамках создания параллельного корпуса (kv-ru) и машинного переводчика:

2.1. Приобретение, сканирование и создание pdf копий 36 русскоязычных изданий, с которых были сделаны коми переводы: "Б. В. Всесвятский. Ботаника" (1957), "В. Ф. Шалаев и Н. А. Рыков. Зоология" (1952), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957), "М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953), "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951).

2.2. Поиск в сети Интернет и сбор текстов русскоязычных оригиналов 41 комиязычного издания: "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Валентин Катаев. Полклӧн пи" (1947), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Сталин йылысь висьтъяс" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), а также 12 pdf-копий русскоязычных оригиналов коми изданий:  "Н. М. Коробков. Кутузов" (1945),  "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936).

2.3. Распознавание и вычитка в программе ABBYY Fine Reader текстов 42 русскоязычных изданий, имеющих коми эквиваленты: "Ф. П. Коровкин. История Древнего мира" (1962), "Б. В. Всесвятский. Ботаника" (1957), "В. А. Тетюрёв. Ботаника" (1949), "Г. И. Иванов и А. С. Добров. География частей света и важнейших зарубежных стран" (1954), "А. В. Мишулин. История Древнего мира" (1947), "В. Ф. Шалаев, Н. А. Рыков. "Зоология" (1952), "Ли Цзе. Котенок, который вздумал летать" (1958), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940), "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956); обработка распознанных текстов в программе LibreOffice Writer.

2.4. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текстов 90 переводных изданий: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Б. В. Всесвятский. Ботаника" (1957), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "С. А. Пономарёв, Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "В. Ф. Шалаев, Н. А. Рыков. Зоология" (1952), "А. В. Мишулин. Древньӧй мирлӧн история" (1941), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Проф. Н. М. Коробков. Кутузов" (1945), "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), "А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "А. Додэ. Тарасконса Тартарен" (1940), "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин. Передньӧй крайын" (1954), "Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941), "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), Г. Скребицкий "Бӧбъяс да мудеръяс" (1951), "Валентин Катаев. Полклӧн пи" (1947), "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955).

2.5. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.

2.6. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.

2.7. Распознавание и вычитка в программе ABBYY FineReader текста книги О. Уляшева "Излань зыран, коми зыран" на коми и русском языках, проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer; разделение коми и русских текстов по разным файлам, разбивка на строки по предложениям и первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами для параллельного корпуса.
Первичное выравнивание в программе WinMerg комиязычных и русскоязычных текстов книги Е. Козловой «Туй дор бадь» («Придорожная ива») и перевод с помощью телеграм-бота не имеющих иноязычных соотвествий частей текстов произведений Е. Козловой «Шундыр», «Кыр йылын бӧрдіс гудӧк» («На пригорке играла гармонь»), «Туй дор бадь» («Придорожная ива») на русский язык для параллельного корпуса и для включения в базу переводчика.

2.8. Сборка текстов новостной ленты официального портала РК на коми и русском языках за январь - декабрь 2023 г., их выравнивание и включение в параллельный корпус.

2.9. Редактирование русскоязычных новостных текстов радио "Коми гор" за 2018 г. для параллельного корпуса. Разделение новостных текстов радио "Коми гор" за 2015 год на русском и коми языках на новостные тексты и репортажи.

2.10. Перевод на коми язык с помощью телеграм-бота текстов для чек-контроля переводчика на коми язык с последующим редактированием.

2.11. Сбор новостных текстов сайтов komiinform.ru и  bnkomi.ru,  перевод их  с помощью телеграм-бота на коми язык; выравнивание коми и русских текстов в программе WinMerge с редактирование коми текстов для включения в  базу переводчика.

2.12. Перевод с помощью онлайн-ресурса "Майбыр" текстов газеты "Коми му" (2024. №1-5) и текста издания: "А. Шебырев. Фараон" (2019) на русский язык и редактирование перевода для пополнения текстовой базы русско-коми переводчика.

2.13. Подбор материала для перевода на коми язык из массива корпуса текстов, предоставленных МКАO «Яндекс».

2.14. Пополнение параллельного корпуса и текстовой базы переводчика первой группой текстов учебного пособия "Планиметрия курс" на коми и русском языках.

2.15. Первичное развертывание и настройка нейронной библиотеки  глубокого машинного обучения openNMT.

2.16. Проведение работ по обучению модели русско-коми переводчика на  основе нейронных сетей (библиотека Sockeye), обучено 15  экспериментальных моделей.

2.17. Создание бота для автоматизации запросов к переводчику.

2.18. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

2.19. Исправление метаразметки в параллельном корпусе.

2.20. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

Объём русско-коми параллельного корпуса за отчетный период возрос на 251 530 единиц и к 2024-06-21 составляет 1 664 358 выравненных предложений (с повторами).

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий 82 комиязычный изданий: "О. Шлопова. Туръяса мойдъяс да висьтъяс", "Агіт-пјесајас"  (1924), "Щыкӧԁӧм морт" (1924), "Жԁанов Б. А. Кӧԇан машіна" (1930), "Іванов Н. І., Ԁубровін Н. В. Вӧр кылӧԁӧм" (1931), "І. Рејн. Кыԇі вӧчӧма трактор" (1931), "Бојко П. А. Вӧрлеԇӧмын ԁа кылӧԁчӧмын брігаԁајас" (1933), "Б. В. Вԍеԍвјатскіј. Ботаԋіка" (1936), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "М. Н. Скаткин. Природоведение" (1968),  Б. В. Всесвятский. Ботаника" (1940), И. Н. Шевченко. Арифметика" (1957), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "И. И. Заславский да Т. П. Герасимова. Физическӧй география. Начальнӧй курс" (1957), "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "Р. Джованьоли. Спартак" (1939), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Анри Барбюс. Би" (1940), "Гажа мойдъяс" (1948), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), П. Павленко. Степнöй шонді" (1951), С. П. Алексеев, В. Г. Карцов. СССР-лӧн история : 4-ӧд кл. велӧдчан книга" (1963), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "Дм. Медведев. Ыджыд сьӧлӧма йӧз" (1954), "Шӧр нэмъяслӧн история" (1941), "Е. А. Косминский. Средньӧй векъяслӧн история" (1951), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947).

3.2. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов 110 переводных изданий: "Блонская Н. И., Рауш В. А.  География кузя лыддьысян книга" (1957),  "Г. М. Кржижановский. Шу-шу" (1969), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963), "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "С. А. Пономарёв да Н. И. Сырнев. Арифметика кузя задачаяс да упражнениеяс сборник" (1955), "Б. В. Всесвятский. Ботаника" (1940),  "Иванов Г. И., Добров А. С. Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география" (1951), "Тетюрев В. А. Ботаника" (1952), "Шалаев В. Ф., Рыков Н. А. Зоология" (1952), "Коровкин Ф. П.  Древньӧй мирлӧн история" (1963),  "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), "В. Бианки. Висьтъяс да мойдъяс" (1952), "А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940), "Р. Джованьоли. Спартак" (1939), "Л. Жариков. Суровӧй друг йылысь повесть" (1953), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), "А. Гончар. Знаменосецъяс" (1955), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история" (1941), "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957), "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов. Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948), "Али-Баба да нелямын разбойник" (1950), "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950); обработка распознанных текстов в программе LibreOffice Writer.

3.3. Создание фотокопий статей номеров газеты "Югыд туй" за июль-август 1990 года. Распознавание и вычитка в программе ABBYY FineReader текстов газеты "Югыд туй" за 1990-07-05, 1990-07-07, 1990-09-10, 1990-07-12, 1990-07-14, 1990-07-17, 1990-07-19, 1990-07-21, 1990-07-24 и их обработка в программе LibreOffice Writer.

3.4. Электронная подписка на газету "Выль туйӧд" на 2024-2025 гг. с сбор pdf файлов с номерами газеты "Выль туйӧд" за 2022-2023 гг. в закрытой группе редакции газеты.

3.5. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2023. №52; 2024. №№1-24), журналов "Йӧлӧга" (2023. №№11, 12; 2024. №№1-4) и "Войвыв кодзув" (2023 №№11-12; 2024 №1), а также  номеров газеты "Выль туйӧд" (2021. №№ 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44, 45,46 47, 49, 50 51, 52, 53; 2022 №№ 1-10, 12-16, 18, 20-27, 28, 31, 33, 34, 42-49, 50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.6. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 2 733 383 единицы и к 2024-06-21 составляет 84 477 596 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов 5 комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

4.2. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937).

4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1925. №№ 25-37; 1926 №№ 1-8), газеты "Југыԁ туј" (1925. №№ 210, 213, 215, 219, 226, 228, 232, 237, 241, 246, 251; 1926. №№ 19, 20) и журнала "Комі му" (1924. №№ 3, 4-6; 1925 №№ 3-4, 5, 6-7, 8, 9), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".

4.4. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.

Объём молодцовского корпуса за отчетный период возрос на 91 140 единиц и к 2024-06-21 составляет 2 725 274 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 17 номеров газеты "Комі ԍікт" и 15 номеров газеты "Југыԁ туј" за 1925-1926 гг., а также коми текстов 7 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на  683 единицы и к 2024-06-21 составляет 17 467 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по 102 книжным изданиям на коми языке: "Миян Тима Вень (2020ʼ вося альбом)", "Турьяса мойдъяс да висьталӧмъяс (О. Шлопова, 2004ʼ вося небӧг)", "Коми йӧзкостса нӧдкывъяс (2008ʼ вося небӧг)", "Ворсыштам, дзолюк (Остапова З. В., 2005ʼ вося небӧг)", "Коми йӧз кывйӧн нэм кежлӧ пасйыны (2005ʼ вося небӧг)", "Ботаника (5-ӧд да 6-ӧд классъяслы, 1940ʼ вося небӧг)", "А. П. Гайдар. Р. В. С." (1949), "А. П. Гайдар.  Военнöй тайна йылысь мойд" (1953), "Анна Гарф. Со кутшöм миян кияс" (1965), "Лев Кассиль. Губернаторскöй пассажир" (1940), "А. Т. Кононов. Чапаев йылысь рассказъяс" (1953), "Редьярд Киплинг. Слоновöй Тумай" (1939), "Н. М. Коробков. Кутузов" (1945), "Р. В. Куницкий. Лун да вой" (1952), "К. Ф. Огородников. Мый вылын кутсьö му" (1950), "Стендаль. Ванина Ванини" (1940), "А. И. Ульянова-Елизарова. Ильичлöн челядьдырся да школаын велöдчан вояс" (1953), "Г. Уэллс. Эпиорнислöн дi" (1939), "Е. Чарушин. Никитка да сылöн другъяс" (1950), "Е. Чарушин. Кутшöм зверь?" (1950), "Е. Чарушин. Миян дворын" (1949), "Е. Чарушин. Висьтъяс : рисунокъяс авторлöн" (1948), "Лин Цзе. Каньпи, кодi кöсйис лэбавны" (1959), А. В. Кармишин. Тöв да сiйöс используйтöм" (1954), "П. В. Козлов, В. А. Мезенцев. Чуймöдана висьт" (1960), "О. Б. Лепешинская. Клетка да сылöн происхождение" (1954), "В. А. Обручев. Кыдзи артмисны гöраяс да материкъяс" (1955), "И. Ф. Полак. Кад да календарь" (1952), "Зарни кияс" (1953), "А. Додэ. Тарасконса Тартарен" (1940), "Альфонс Додэ. Мичаысь-мича Нивернеза" (1940),  "В. Бианки. Висьтъяс да мойдъяс" (1952), "Р. Джованьоли. Спартак" (1939), "Би (А. Барбюс, 1941ʼ вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", "Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг)", "Ботаника (1952ʼ вося небӧг)", "Гажа мойдъяс (1948ʼ вося небӧг)", "География (4-ӧд класслы 1956ʼ вося небӧг)"‎‎, "География кузя лыддьысян книга (1957ʼ вося небӧг)", "Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг)", "Зоология (1952ʼ вося небӧг)"‎‎, "Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг)", "Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг)", "Руч да кӧч (1959ʼ вося небӧг)", "Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг)", "СССР-лӧн география (1957ʼ вося небӧг)", "СССР-лӧн история (1963ʼ вося небӧг)"‎‎, "Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг)", "Тема да Жучка (1954ʼ вося небӧг)", "Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг)", "Январь 9-ӧд лун (М. Горький, 1958ʼ вося небӧг)", "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)", "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎, "Ванька (1937ʼ вося небӧг)", "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎".

6.2. Создание на справочном wiki-ресурсе "Коми тӧданін" указателей содержания по отдельным номерам журнала "Войвыв кодзув" (2022 №"8-12, 2023 №№1-12, 2024. №№ 1-3).

6.3. Создание и заполнение wiki-страниц с оглавлением по 30 номерам газет "Комі ԍікт" и "Југыԁ туј" за 1925-1926 гг. в онлайн-справочнике "Коми тӧданін".

6.4. Добавление в указатель публикаций газеты "Коми му" на справочном wiki-ресурсе "Коми тӧданін" содержания номеров за 2023 год.

6.5. Пополнение страниц авторов и переводчиков ссылками на издания, добавленные за истекший период

7. Пополнение лексической базы FU-Lab:

7.1. Предварительная разметка электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».

8. Помощь коллегам в других регионах и сторонних организациях:

8.1. Разбивка на произведения, распределение по отдельным файлам и метаразметка русскоязычных художественных текстов, подготовленных в рамках создания параллельного корпуса на коми и русском языках для коллег в других регионах, занимающихся аналогичной работой.

8.2. Разбивка и первичное выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текста удмуртского издания "Л. Воронкова. Пичи нылъёс школае мыно" (1953) как образец данного вида работы для сектора языка УИИЯЛ УдмФИЦ УрО РАН.

8.3. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.

9. Создание мультиязычного корпуса по пермским языкам:

9.1. Создание первичной версии интерфейса параллельного корпуса по пермским языкам.

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

10.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

11. Иное

11.1. Создание видеоролика по установке на мобильный телефон коми раскладки для Яндекс Клавиатуры.

11.2. Распространение комиязычного контента в соц. сетях.

11.3. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

11.4. Оптимизация настроек сайтов лаборатории для повышения их позиций при индексации в поисковых системах.

11.5. Адаптивная HTML-вёрстка новой структуры группы сайтов fu-lab.ru.

12. Участие в мероприятиях и выступления в сми:

12.1. Участие в съёмках для передачи "Ас му вылын" (телеканал "Коми гор", эфир 21.03.2024).

12.2. Проведение организационного собрания для переводчиков предложений, предоставленных для перевода на коми язык МКАO «Яндекс», составление и размещение инструкции по переводу данных текстов на вики ресурсе wiki.fu-lab.ru, распределение и рассылка материала переводчикам (25.01.2024).

12.3. Выступление перед слушателями курсов коми языка, проводящихся в ГАУ РК "Дом дружбы народов Республики Коми" (14.02.2024).

12.4. Участие в V международной научно-практической конференции «Электронная письменность в России: опыт, задачи, векторы развития» (Йошкар-Ола, 21-22.02.2024), выступление в Марийском научно-исследовательском институте языка, литературы и истории им. В.М. Васильева с докладом на тему "Процесс формирования текстовой базы для параллельного русско-коми корпуса и автоматического переводчика" (22.02.2024).

12.5. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).

12.6. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).

12.7. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024) и выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).

12.8. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).

2024ʼ вося мӧд кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 9:34 21.06.2024

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Сканирование и создание pdf копий русскоязычных изданий, с которых были сделаны коми переводы: "А. Додэ. Тартарен из Тараскона" (1938), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "Чу Чэн. Тайна разрушенного храма" (1958), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "История средних веков. 6-7 класс" (1940), "О. Иваненко. Тарасова доля" (1940), "Наша дорога : рассказы польских писателей" (1953), "И. Н. Шевченко. Арифметика" (1959), "В. К. Арсеньев. Дерсу Узала" (1955), "И. Арамилев. На лесной тропе" (1952), "Ю. Сотник. Один страшный день" (1962), "А. Авдеенко. У карпатского костра" (1957)", "М. Марьенков. Знак дружбы" (1950), "Б. Емельянов. Мечта" (1955), "Анри Барбюс. Огонь" (1935), "О. Б. Лепешинская. Клетка и ее происхождение" (1951); "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953), "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951).

2.2. Распознавание и вычитка в программе ABBYY Fine Reader текстов русскоязычных изданий, имеющих коми эквиваленты: "Е. А. Косминский. История средних веков" (1960), "Р. Джованьоли. Спартак" (1936), "А. Додэ. Тартарен из Тараскона" (1938), "Чу Чэн. Тайна разрушенного храма" (1958), "М. Водопьянов. Гордое слово" (1955), "Болгарские сказки" (1957), "М. Ильин, Е. Сегал. В нашем городе" (1955), "В. Каверин. Мужество" (1954), "Ованес Гукасян. Маленькие мстители" (1952), "Венгерские народные сказки" (1958), "Жан Грива. Рассказы об Испании" (1953), "Глеб Комаровский, Николай Комаровский. Повесть о корейском мальчике" (1950), "Китайские народные сказки" (1953), "С. П. Алексеев, В. Г. Карцов. История СССР" (1961), "Е. Д. Стасова. Таким был В. И. Ленин" (1965), "Ю. Сотник. Как я был самостоятельным" (1959), "Макс Зингер. Рассказы старого полярника" (1959), "О. Иваненко. Тарасова доля" (1940), "История средних веков" (1940), "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951); обработка распознанных текстов в программе LibreOffice Writer.

2.3. Выравнивание по предложениям в программе WinMerge с русскоязычным оригиналом текстов переводных изданий "Е. А. Косминский. Шӧр нэмъяслӧн история" (1955), "Р. Джованьоли. Спартак" (1939), " А. Гончар. Знаменосецъяс" (1955), "П. Павленко. Степнӧй шонді" (1951), "Борис Полевой. Ми — сӧветскöй йӧз" (1951), Д. Медведев. Ыджыд сьӧлӧма йӧз", "А. Додэ. Тарасконса Тартарен" (1940), "Чу Чэн. Киссьӧм храмлӧн гусятор" (1959), "Болгарсӧй мойдъяс" (1958), "Венгерскӧй народнӧй мойдъяс" (1958), "Жан Грива. Испания йылысь рассказъяс" (1955), "Ованес Гукасян. Ичӧтик мстительяс" (1955), "М. Ильин, Е. Сегал. Миян карын" (1957), "В. Каверин. Мужестволӧн школа" (1957), "Китайскӧй народнӧй мойдъяс" (1953), "Глеб Комаровский, Николай Комаровский. Корейскӧй детинка йылысь повесть" (1953), "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Ю. Сотник. Кыдзи ме олі ас кежын" (1961), "М. Зингер. Пӧрысь полярниклӧн висьтъяс" (1962), "О. Иваненко. Тараслӧн доля" (1940), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин. Передньӧй крайын" (1954), Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941), "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), Г. Скребицкий "Бӧбъяс да мудеръяс", "В. Катаев. Полклӧн пи", "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955).

2.4. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.

2.5. Создание фотокопий страниц издания "П. В. Козлов, В. А. Мезенцев. Чудесная быль" (1958), распознавание и вычитка в программе ABBYY Fine Reader, обработка в программе LibreOffice Writer и первичное выравнивание в программе WinMerge с ранее распознанным коми переводом 1960 года.

2.6. Редактирование машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).

2.7. Добавление в параллельный русско-коми корпус выравненных текстов, обработанных за отчетный период.

2.8. Исправление метаразметки в параллельном корпусе.

2.9. Продолжение унификации орфографии и модернизации терминологиии в датасете для нейросети.

2.10. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.

Объём параллельного корпуса коми языка за отчетный период возрос на 162 636 единиц и к 2024-06-21 составляет 1 664 358 выравненных предложений.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычный изданий: "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954)", "Шӧр нэмъяслӧн история (1941)", "Е. А. Косминский. Средньӧй векъяслӧн история" (1951), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947).

3.2. Распознавание и вычитка в программе ABBYY Fine Reader коми текстов переводных изданий: "А. А. Фадеев. Метелица" (1954), "А. С. Пушкин. Чери кыйысь да чери йылысь мойд" (1956), "Е. Д. Стасова. Татшöм волi Владимир Ильич Ленин" (1966), "К. С. Косяков. Алкоголизмкöд тышкасьöм" (1958), "М. Горький. Мойдъяс" (1952), "М. Горький. Январь 9-öд лун" (1958), "Н. Г. Гарин-Михайловский. Тема да Жучка" (1954), "О. Туманян. Кöзяин да работник" (1952), "Руч да кöч" (1959), "А. Барбюс. Би" (1941), "Дм. Медведев. Ыджыд сьӧлӧма йӧз (1954), "С. П. Алексеев, В. Г. Карцов. СССР-лӧн история" (1963), "Шӧр нэмъяслӧн история (1941)", "П. Павленко. Степнӧй шонді" (1951), "Е. Юнга. Бессмертнӧй корабль" (1953), "А. Матвеев. Александр Матросов" (1953), "М. Марьенков. Дружба" (1958), "В. Панова. Серёжа" (1960), "Н. Островский. Бушковын чужысьяс" (1957), "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957), "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов. Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948), "Али-Баба да нелямын разбойник" (1950), "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950); обработка распознанных текстов в программе LibreOffice Writer.

3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №12-24) и журнала "Йӧлӧга" (2024. №3, 4), а также номеров газеты "Выль туйӧд" (2022 год. №№ 2-10, 12-16, 18, 20-27, 28, 31, 33, 34, 42-49, 50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).

3.4. Добавление в корпус коми языка текстов, обработанных за отчетный период.

Объём корпуса коми языка за отчетный период возрос на 1 665 291 единицу и к 2024-06-21 составляет 84 477 596 словоупотреблений.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.

4.2. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937).

4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926 №№ 1-8), газеты "Југыԁ туј" (1926. №19, 20) и журнала "Комі му" (1924. №№3, 4-6; 1925 №№3-4, 5, 6-7, 8, 9), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".

4.4. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.

Объём молодцовского корпуса за отчетный период возрос на 14 442 единицы и к 2024-06-21 составляет 2 725 274 словоупотреблений.

5. Пополнение онлайн библиотеки "Коми гижӧд":

5.1. Размещение в онлайн библиотеке "Коми гижӧд" коми текстов 8 номеров газеты "Комі ԍікт" и 2 номеров газеты "Југыԁ туј" за 1926, а такжекоми текстов 7 выпусков журнала "Комі му" за 1924-25 гг. в переводе на современную графику.

Количество текстов в библиотеке за отчетный период возрасло на 217 единиц и к 2024-06-21 составляет 17 467 текстов.

6. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

6.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Би (А. Барбюс, 1941ʼ вося небӧг)", "Ыджыд сьӧлӧма йӧз (Д. Медведев, 1954ʼ вося небӧг)", "Коми ошканкывъяс (Е. Цыпановлӧн 2024ʼ вося небӧг)", "Степнӧй шонді (П. А. Павленко, 1951ʼ вося небӧг)", "Зарни кияс (1953ʼ вося небӧг)"‎, "Метелица (А. А. Фадеев, 1954ʼ вося небӧг)", "Средньӧй векъяслӧн история (1951 вося небӧг)"‎, "Шӧр нэмъяслӧн история (1941ʼ вося небӧг)", Алкоголизмкӧд тышкасьӧм (К. С. Косяков, 1958ʼ вося небӧг), Ботаника (1952ʼ вося небӧг), Гажа мойдъяс (1948ʼ вося небӧг), География (4-ӧд класслы 1956ʼ вося небӧг)‎‎, География кузя лыддьысян книга (1957ʼ вося небӧг), Древньӧй мирлӧн история (5-ӧд класс, 1963' вося небӧг), Зоология (1952ʼ вося небӧг)‎‎, Кӧзяин да работник (О. Туманян, 1952ʼ вося небӧг), Мойдъяс (М. Горькӧй, 1952ʼ вося небӧг), Руч да кӧч (1959ʼ вося небӧг), Свет юкӧнъяслӧн да важнейшӧй зарубежнӧй странаяслӧн география (1951ʼ вося небӧг), СССР-лӧн география (1957ʼ вося небӧг), СССР-лӧн история (1963ʼ вося небӧг)‎‎, Татшӧм вӧлі Владимир Ильич Ленин (Е. Д. Стасова, 1966ʼ вося небӧг), Тема да Жучка (1954ʼ вося небӧг), Чери кыйысь да чери йылысь мойд (А. С. Пушкин, 1956ʼ вося небӧг), Январь 9-ӧд лун (М. Горький , 1958ʼ вося небӧг), "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)", "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎, "Ванька (1937ʼ вося небӧг)", "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎".

6.2. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по последним номерам журнала "Войвыв кодзув" (2023. №№ 6-12; 2024. №№ 1-3).

6.3.Создание и заполнение wiki-страниц с оглавлением по 8 номерам газеты "Комі ԍікт" за 1926 год в онлайн-справочнике "Коми тӧданін".

7. Пополнение лексической базы FU-Lab:

7.1. Предварительная разметка электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».

8. Помощь коллегам в регионах:

8.1. Разбивка по точке и выравнивание по предложениям в программе WinMerge с русскоязчыным оригиналом текста удмуртского издания "Л. Воронкова. Пичи нылъёс школае мыно" (1953).

9. Пополнение словарной базы средства проверки правописания Hunspell:

9.1. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.

9.2. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.

10. Распространение комиязычного контента в соц. сетях.

11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

12. Участие в мероприятиях:

12.1. Презентация продуктов ЦИЯТ и проведения мастер-класса на Республиканском фестивале мастер-классов среди педагогических работников Республики Коми по сохранению коми языка, культуры и традиций коми народа (с. Мохча, 05.04.2024).

12.2. Проведение мастер-класса в Сыктывкарском гуманитарно-педагогическом колледже по ознакомлению студентов дошкольного отделения с онлайн-ресурсами лаборатории FU-Lab по коми языку и другим комиязычным ресурсам интернета (13.04.2024).

12.3. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024) и выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).

12.4. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).

2024ʼ лӧддза-номъя тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 19:48 20.06.2024

2024-05-27–2024-06-21.
 

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935), "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), комиязычных изданий "Миян туй" (1957), "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951), "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий:  "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), "Г. Скребицкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959), "Забавные сказки" (1951); обработка распознанных текстов в программе LibreOffice Writer.
  4. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "А. Афанасьев. Царевна-лягушка" (1951), "А. И. Герцен. Повестьяс" (1956), "Арк. Гайдар. Тимур да сылӧн команда" (1941), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "В. Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1947), "Г. Х. Андерсен. Дюймовочка" (1952), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "Е. Смирнов. Павлик Морозов" (1940), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "Л. Н. Толстой. Кык ёрт" (1952), "Л. Толстой. Рассказъяс" (1950), "М. Горький. Висьтъяс" (1947), "М. Горький. Иванушка-дурачок йылысь" (1947), "Миян туй" (1957), "М. Лермонтов. Миян кадся герой" (1939), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Н. А. Некрасов. Мазай дед да кӧчьяс" (1956), "Н. А. Островскӧй. Гроза" (1941), "Русскӧй богатырьяс" (1951), "С. Т. Аксаков. Алӧй дзоридз" (1951), "Чоя-вока" (1950); обработка распознанных текстов в программе LibreOffice Writer.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных изданий: "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937); проверка орфографии, обработка распознанных текстов  в программе LibreOffice Writer.
  6. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937).
  7. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952),  "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936),  Г. Скребицкий "Бӧбъяс да мудеръяс", "В. Катаев. Полклӧн пи", "П. Журба. Александр Матросов" (1951), "Б. Емельянов. Мечта" (1955).
  8. Загрузка новых текстов в монокорпус и параллельный русско-коми корпус.
  9. Исправление метаразметки в параллельном корпусе.
  10. Создание фотокопий отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"), "Б. Емельянов. Мечта" (1955). Обработка и распознавание фотоснимков в программе  ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.
  11. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)", "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎,  "Ванька (1937ʼ вося небӧг)",  "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎".
  12. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №22-24)  и журнала "Йӧлӧга" (2024. №3, 4), а также номеров газеты "Выль туйӧд" (2022 год. №№50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  13. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№ 7, 8) и журнала "Комі му" (1925 №№8, 9), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  14. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  15. Продолжение разметки "Коми-пермяцко-русского словаря" для сайта "Онлайн словари FU-Lab".
  16. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.
  17. Продолжение подготовительной работы по созданию средства проверки коми орфографии для популярных браузеров.
  18. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  19. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  20. Распространение комиязычного контента в соц. сетях.
  21. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  22. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024).
  23. Выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).
  24. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (Сыктывкар, 15.06.2024).
FU-Lab. 2024.06.17.-2024.06.21.

опубликовал Öньö Лав в 18:09 20.06.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.06.17.-2024.06.21.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "П. Игнатов. Вокъяс-геройяс" (1947), "Федор Гладков. Клятва" (1947).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий:  "Русскӧй богатырьяс" (1951), "Е. Смирнов. Павлик Морозов" (1940), "М. Горький. Висьтъяс" (1947), а также издания на молодцовице "О. Перовскаја. Чеԉаԃјас ԁа ԅверјас" (1937) и рускоязычного издания "Забавные сказки" (1951).
  4. Перевод на современную графику и корректура модернизированного текста издания "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937).
  5. Создание фотокопий недостающих страниц издания "Б. Емельянов. Мечта" (1955), их распознавание и обработка в программе "LibreOffice Writer", интеграция с основным текстом.
  6. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текста издания: "Б. Емельянов. Мечта" (1955).
  7. Загрузка новых текстов в монокорпус и параллельный русско-коми корпус.
  8. Исправление метаразметки в параллельном корпусе.
  9. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №24) и журнала "Йӧлӧга" (2024. №4); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №8), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  11. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  12. Продолжение разметки "Коми-пермяцко-русского словаря".
  13. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  14. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  15. Распространение комиязычного контента в соц. сетях.
  16. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  17. Проведение семинара для представителей рабочей группы по созданию корпуса коми-пермяцкого языка (15.06.2024).
FU-Lab. 2024.06.10.-2024.06.14.

опубликовал Öньö Лав в 20:38 13.06.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.06.10.-2024.06.14.

  1.  
  2. Приобретение, сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "Забавные сказки" (1951), "А. Новиков-Прибой. Цусима. Книга вторая" (1935).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов комиязычных изданий: "Русскӧй богатырьяс" (1951), "В. Катаев. Полклӧн пи" (1947), "Г. Скребницкий. Бӧбъяс да мудеръяс" (1947); обработка распознанных текстов в программе LibreOffice Writer.
  4. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий:  "Г. Скребницкий. Простофили и хитрецы" (1944), "И. Н. Шевченко. Арифметика для 5 и 6 классов" (1959); обработка распознанных текстов в программе LibreOffice Writer.
  5. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: Г. Скребницкий "Бӧбъяс да мудеръяс", "В. Катаев. Полклӧн пи", "П. Журба. Александр Матросов" (1951).
  6. Обработка в программе ABBYY FineReader и создание pdf копии научного издания "Károly Rédei. Zyrian texts" (1996) по просьбе сектора языка ФИЦ Коми НЦ УрО РАН.
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Полклӧн пи (В. Катаев, 1947ʼ вося небӧг)", "Бӧбъяс да мудеръяс (1947ʼ вося небӧг)", "Висьтъяс (М. Горькӧй, 1947ʼ вося небӧг)", "Иванушка-дурачок йылысь (М. Горькӧй, 1947ʼ вося небӧг)", "Генерал Топтыгин (Н. А. Некрасов, 1947ʼ вося небӧг)", "Павлик Морозов (Е. Смирнов, 1940ʼ вося небӧг)".
  8. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №23) и журнала "Йӧлӧга" (2024. №3); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925 №9),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  11. Продолжение подготовительной работы по созданию средства проверки коми орфографии для популярных браузеров.
  12. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  13. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  16. Выступление в рамках дискуссии «Возможности IT в сфере поддержки и развития родных языков» с презентацией ресурсов Межрегиональной лаборатории информационной поддержки функционирования финно-угорских языков (Москва, 08.06.2024).
FU-Lab. 2024.06.03.-2024.06.07.

опубликовал Öньö Лав в 18:54 05.06.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.06.03.-2024.06.07.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий комиязычных изданий: "Валентин Катаев. Полклӧн пи" (1947), "Г. Скребицкий. Бӧбъяс да мудеръяс" (1951).
  3. Продолжение распознавания и вычитки в программе ABBYY FineReader текстов изданий: "М. Лермонтов. Миян кадся герой" (1939), "П. Журба. Александр Матросов" (1951), обработка текстов в программе LibreOffice Writer.
  4. Распознавание и вычитка в программе ABBYY FineReader, проверка орфографии, обработка в программе LibreOffice Writer текстов изданий: "А. Чехов. Бӧрйӧм гижӧдъяс" (1939), "Віктор Гјуго. Ӧкмысԁас којмӧԁ" (1937), "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок йылысь" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947).
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №7), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.    
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  9. Участие в фестивале национальных литератур народов России "Красная площадь" (Москва, 6-9.06.2024).
FU-Lab. 2024.05.27.-2024.05.31.

опубликовал Öньö Лав в 23:33 30.05.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.05.27.-2024.05.31.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "Золотые руки" (1950), "П. Журба. Александр Матросов" (1951), а также комиязычного издания "Миян туй" (1957).
  3. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычного издания "Золотые руки" (1950), проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для дальнейшего выравнивания с  текстом коми перевода.
  4. Распознавание и вычитка в программе ABBYY Fine Reader текстов комиязычных изданий с pdf копий, предоставленных ГБУ РК «Национальная библиотека Республики Коми»: "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Л. Толстой. Рассказъяс" (1950), "К. Ушинскӧй. Бишка"(1950), "К. Ушинскӧй. Кыдзи дӧрӧм му вылын быдмис" (1950), "К. Ушинскӧй. Рассказъяс" (1950), "А. Афанасьев. Царевна-лягушка" (1951),  "С. Т. Аксаков. Алӧй дзоридз" (1951), "Д. Григорович. Гуттаперчевӧй детинка" (1951), "Г. Х. Андерсен. Дюймовочка" (1952), "Л. Н. Толстой. Кык ёрт" (1952), "Д. Мамин-Сибиряк. Руд Сьылі" (1950), "Д. Н. Мамин-Сибиряк. Медведко" (1953), "А. С. Пушкин. Поп да сылӧн казак балда йылысь мойд" (1954), "Н. А. Некрасов. Мазай дед да кӧчьяс"(1956), "А. И. Герцен. Повестьяс" (1956), "А. Тостой. Зарни Ключ, либӧ Буратинолӧн приключениеяс" (1950), а также издания "Миян туй" (1957); проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer.
  5. Конвертация на современную графику молодцовских текстов и обработка в программе LibreOffice Writer модернизированных текстов изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937), предоставленных ГБУ РК «Национальная библиотека Республики Коми».
  6. Разбивка по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge коми текстов изданий: "Арк. Гайдар. Тимур да сылӧн команда" (1941), "Н. А. Островскӧй. Гроза" (1941), "В. Г. Короленко. Му пытшкын олысь челядь" (1952), "Миян туй" (1957), "А. И. Герцен. Повестьяс" (1956), "Г. Х. Андерсен. Дюймовочка" (1952),  "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936).
  7. Начало распознавания и вычитки в программе ABBYY FineReader текстов изданий: "М. Лермонтов. Миян кадся герой" (1939, на коми языке), "П. Журба. Александр Матросов" (1951, на русском языке).
  8. Создание фотокопий по экземплярам из фонда ФГБУ "Российская государственная библиотека" отсутствовавших страниц изданий: "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6 класса. Издание шестнадцатое" (1954. С. 179, 180); "С. П. Алексеев и В. Г. Карцов. История СССР. Учебная книга для 4-го класса. Шестое издание" (1961. С. 137, 138, 131, 132); "О. Иваненко. Тарасова доля" (1940. С. 59, 60, 61, 62); "Анри Барбюс. Огонь" (1935. С. 183, 184, 193, 194); "М. Белахова. Драгоценный груз" (1950, рассказы: "В Калькутту", "Случай в самолёте"); "Г. И. Иванов, А. С. Добров. География частей света и важнейших зарубежных стран. Учебник для 6-го класса. 12-е изд." (1950, разделы: "Югославия", "Турция"). Обработка и распознавание фотоснимков в программе  ABBYY Fine Reader и добавление недостающих частей текста в параллельный корпус.
  9. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Мюнхаузенлӧн приключениеяс (1938ʼ вося небӧг)", "Гулливер лиллипутъяс ордын (1936ʼ вося небӧг)"‎‎,  "Ванька (1937ʼ вося небӧг)",  "Гулливер великанъяс ордын (1939ʼ вося небӧг)"‎‎, "Тарас Бульба (Н. В. Гоголь, 1939ʼ вося небӧг)"‎‎, "Вий (Н. В. Гоголь, 1939ʼ вося небӧг)‎‎", "Миян туй (1957ʼ вося небӧг)", "Муму (И. С. Тургенев, 1957ʼ вося небӧг)‎‎".
  10. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №22) и номеров газеты "Выль туйӧд" (2022 год. №№50-52, 2023. №№1-2); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  11. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  12. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925 №8),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  13. Продолжение подготовительной работы по созданию средства проверки коми орфографии для популярных браузеров.
  14. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  15. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2024ʼ ода-кора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 21:19 22.05.2024

2024-04-29–2024-05-24.

  1.  
  2. Сканирование, обработка в программе ABBYY FineReader и создание pdf копий русскоязычных изданий: "О. Б. Лепешинская. Клетка и ее происхождение" (1951);  "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956), "Иван Франко. Рассказы" (1953); комиязычных изданий: "Чоя-вока" (1950), "М. Горький. Иванушка-дурачок" (1947), "М. Горький. Висьтъяс" (1947), "Н. А. Некрасов. Генерал Топтыгин" (1947), "Е. Смирнов. Павлик Морозов" (1940), "Ԋ. Островскіј. Бушковын чужыԍјас" (1937), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941).
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе  LibreOffice Writer текстов русскоязычных изданий: "А. Барбюс. Огонь" (1936), "В. К. Арсеньев. Дерсу Узала" (1955), "М. Марьенков. Знак дружбы" (1950), "И. Арамилев. На охотничьей тропе" (1952), "А. Авдеенко. У Карпатского костра" (1957), "Ю. Сотник. Один страшный день" (1962), "О. Б. Лепешинская. Клетка и ее происхождение" (1951), "И. Н. Шевченко. Арифметика" (1959), "Наша дорога" (1953), "Б. Емельянов. Мечта" (1955), а также рассказов из русскоязычных изданий: "Го Мо-жо. Избранное" (1953), "Мао Дунь. Сочинения. Том третий" (1956).
  4. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе  LibreOffice Writer текстов комиязычных изданий: "А. Новиков-Прибой. Цусима. Мӧд книга" (1948), "Ж. Рони-старший. Би вöсна тыш" (1940), "А. Новиков-Прибой. Забавнöй вöскресенья" (1940), "М. Горький. Ильялöн ичöтдырся олöм" (1940), "Куим пи" (1940), "В. Г. Короленко. Синтöм музыкант" (1940), "Сталин йылысь висьтъяс" (1941), "Александр Серафимович. Воробьинöй вой" (1941), "Ленин йылысь висьтъяс" (1941), "Хечо-лентяй" (1941), "И. Н. Шевченко. Арифметика" (1957),  "В. Овечкин. Передньӧй крайын" (1954), "Б. Емельянов.  Мечта" (1957), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948),  "Али-Баба да нелямын разбойник" (1950); проверка орфографии и обработка распознанных текстов в программе LibreOffice Writer.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937); проверка орфографии, обработка распознанных текстов  в программе LibreOffice Writer.
  6. Разбивка на строки по предложениям и первичное выравнивание с русским оригиналом в программе WinMerge  текстов коми изданий: "В. К. Арсеньев. Дерсу Узала" (1957), "М. Марьенков. Дружба" (1958), "И. Арамилев. Вӧралан трӧпа вылын" (1956), А. Авдеенко "Карпатскӧй бипур дорын" (1962), "Ю. Сотник. Ӧти страшнӧй лун" (1964), "О. Б. Лепешинская. Клетка да сылӧн происхождение" (1954), "Шӧр нэмъяслӧн история" (1941), "В. Овечкин.  Передньӧй крайын" (1954), Ж. Рони-Старший. Би вӧсна тыш" (1940), "Го Мо-жо. Рассказъяс" (1954), "Мао Дунь. Рассказъяс" (1957), "Сталин йылысь висьтъяс" (1941),  "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940).
  7. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)".
  8. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2024. №17-21) и номера газеты "Выль туйӧд" (2022 год. №42-49); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Комі ԍікт" (1926. №№5, 6), и журнала "Комі му" (1925 №№3-4, 5, 6-7), их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Продолжение редактирования машинного перевода на русский язык текста издания: "А. Шебырев. Фараон" (2019).
  11. Разработка плана реализации функции альтернативного поиска в корпусе коми языка на современной и прежних системах письма в текстах донациональной, молодцовской и латинской эпох коми письменности.
  12. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.
  13. Начало предварительной разметки электронной версии коми-пермяцкого словаря для его добавления на сайт «Онлайн словари FU-Lab».
  14. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  15. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab. 2024.05.20.-2024.05.24.

опубликовал Öньö Лав в 21:05 22.05.2024

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2024.05.20.-2024.05.24.

  1.  
  2. Распознавание и вычитка в программе ABBYY FineReader текстов русскоязычных изданий "Наша дорога" (1953) и "Б. Емельянов. Мечта" (1955), проверка орфографии, обработка распознанных текстов в программе LibreOffice Writer для дальнейшего выравнивания с  текстом коми перевода.
  3. Распознавание и вычитка в программе ABBYY Fine Reader текстов комиязычных изданий: "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "Джонатан Свифт. Гулливер великанъяс ордын" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940), "Г.-Х. Андерсен. Мисьтӧм уткапи" (1939), "Г.-Х. Андерсен. Стойкӧй озысь салдат" (1947), "В. Маяковский. Челядьлы" (1948),  "Али-Баба да нелямын разбойник" (1950); проверка орфографии и обработка распознанных текстов в программе LibreOffice Writer.
  4. Распознавание и вычитка в программе ABBYY Fine Reader молодцовских текстов комиязычных изданий: "Е. Распе. Мјунхауԅенлӧн прікԉучеԋіјејас" (1938), "Гуԉԉівер ԉіԉԉіпутјас орԁын" (1936), "А. П. Чехов. Ваԋка" (1937); проверка орфографии, обработка распознанных текстов  в программе LibreOffice Writer.
  5. Разбивка по предложениям и первичное выравнивание в программе WinMerge коми текстов с русским оригиналом: "Анри Барбюс. Би" (1941), "Н. В. Гоголь. Вий" (1939), "Н. В. Гоголь. Тарас Бульба" (1939), "И. С. Тургенев. Муму" (1957), "И. С. Тургенев. Батьяс да пиян" (1940).
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Би вöсна тыш (1940ʼ вося небӧг)", "Забавнöй вöскресенья (1940ʼ вося небӧг)", "Ильялöн ичöтдырся олöм (1940ʼ вося небӧг)", "Куим пи (1940ʼ вося небӧг)", "Синтöм музыкант (1940ʼ вося небӧг)", "Сталин йылысь висьтъяс (1941ʼ вося небӧг)", "Воробьинöй вой (А. Серафимович, 1941ʼ вося небӧг)", "Ленин йылысь висьтъяс (1941ʼ вося небӧг)", "Хечо-лентяй (1941ʼ вося небӧг)", "Стойкӧй озысь салдат (Г. Х. Андерсен, 1947ʼ вося небӧг)", "Челядьлы (В. Маяковскӧй, 1948ʼ вося небӧг)", "Али-Баба да нелямын разбойник (1950ʼ вося небӧг)", "Руд Сьылі (Д. Н. Мамин-Сибиряк, 1950ʼ вося небӧг)", "Рассказъяс (Л. Н. Толстой, 1950ʼ вося небӧг)", "Бишка (К. Ушинскӧй, 1950ʼ вося небӧг)", "Кыдзи дӧрӧм му вылын быдмис (К. Ушинскӧй, 1950ʼ вося небӧг)", Царевна-лягушка (1951ʼ вося небӧг), "Алӧй дзоридз (1951ʼ вося небӧг)", "Дюймовочка (1952ʼ вося небӧг)", "Кык ёрт (Л. Н. Толстой, 1952ʼ вося небӧг)", "Медведко (1953ʼ вося небӧг)", "Поп да сылӧн казак Балда йылысь мойд (А. С. Пушкин, 1954ʼ вося небӧг)", "Мазай дед да кӧчьяс (Н. А. Некрасов, 1956ʼ вося небӧг)", "Повестьяс (А. И. Герцен, 1956ʼ вося небӧг)", "Му пытшкын олысь челядь (В. Г. Короленко, 1952ʼ вося небӧг)", "Русскӧй богатыръяс (1951ʼ вося небӧг)", "Зарни ключ, либӧ Буратинолӧн приключениеяс (А. Н. Толстой, 1950ʼ вося небӧг)", "Гроза (А. Н. Островскӧй, 1941ʼ вося небӧг)", "Тимур да сылӧн команда (А. Гайдар, 1941ʼ вося небӧг)", "Миян кадся герой (М. Ю. Лермонтов, 1939ʼ вося небӧг)", "Бӧрйӧм гижӧдъяс (А. П. Чехов, 1939ʼ вося небӧг)".
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (2024. №21) и номеров газеты "Выль туйӧд" (2022 год. №№43-49); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка и расстановка языковых тэгов).
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов журнала "Комі му" (1925 №№3-4, 5, 6-7),  их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Подготовительная работа по созданию средства проверки коми орфографии для популярных браузеров.
  10. Работа по обучению модели глубокого машинного обучения (ИИ) в рамках создания русско-коми переводчика.
  11. Пополнение словарной базы коми спелл-чеккера hunspell новой лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика