FU-Lab 2022.11.21 – 2022.11.25

опубликовал Öньö Лав в 13:22 24.11.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.11.21 – 2022.11.25

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование  в программе ABBYY FineReader переводных книжных изданий и создание их электронных копий в формате pdf: "Кассиль Л. А. Менам дона детинкаяс" (1948), "Гайдар А. П. Ылысса странаяс" (1952), "Максим Горький. Архип дед да Лёнька" (1953), "Воронкова Л. Алтайскӧй повесть" (1954), "Максим Горький. Рассказъяс" (1954), "Баныкин В. И. Тулысын ытва дырйи" (1955),  "Пушкин А. С. Покойнӧй Иван Петрович Белкинлӧн повестьяс" (1955), "Кржижановскӧй Г. М. Шу-Шу" (1969).
  4. Распознавание в программе ABBYY FineReader и обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текста переводного издания "Воронкова Л. Алтайскӧй повесть" (1954).
  5. Обработка в программе LibreOffice Writer (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) раннее распознанных коми текстов изданий "Предпутие. Туйводз 2" (2021), "А. Мусатов. Стожары" (1950), "Г. Николаева. Вундандыр" (1952), добавление данных текстов в корпус коми языка.
  6. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданям на коми языке: "Алтайскӧй повесть (1954ʼ вося небӧг)", "Стожары (1950ʼ вося небӧг)", "Вундандыр (1952ʼ вося небӧг)"
  7. Первичное выравнивание в программе WinMerge коми и русских текстов переводных изданий "А. Батров. Миян друг Хосе" (1954), "Максим Горький. Висьтъяс" (1952), "В. Дуров. Менам зверьяс" (1958), "Вашингтон Ирвинг. Рип Ван Винкль" (1939), "Н. С. Лесков. Рассказъяс" (1954), "Марк Твен. Чеччалысь лягуша" (1939), "М. Е. Салтыков-Щедрин. Бӧрйӧм гижӧдъяс" (1939), "К. Станюкович. Морскӧй висьтъяс" (1947), "В. Тендряков. Повесть да рассказъяс" (1958), "Юлиус Фучик. Казнь водзвылын кыв" (1953), "А. П. Чехов. Рассказъяс" (1954), "М. А. Шолохов. Лэптӧм эжа. Мӧд книга" (1961), "А. Мусатов. Стожары" (1950), "Г. Николаева. Вундандыр" (1952), "Воронкова Л. Алтайскӧй повесть" (1954), "Предпутие. Туйводз 2" (2021); включение данных текстов в параллельный корпус.
  8. Завершение выравнивания в программе WinMerge текстов русских переводов с коми оригиналами по изданиям "И. Торопов. Вам жить дальше" (1981) и "Иван Торопов. Тіянлы водзӧ овны" (1980) для корпуса параллельных текстов.
  9. Сравнение и корректирование в программе Meld двух публикаций пьесы В. Леканова "Сиктса рытъяс" (1954 и 1988 гг.) для редакции журнала "Войвыв кодзув".
  10. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№47); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  11. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-29, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  12. Создание wiki-пространства с поддоменом selkup.fu-lab.ru для публикации специалистами лингвистических разработок по селькупскому языку.
  13. Сбор и систематизация материалов, представленных на конкурс лучших методических разработок с использованием электронных ресурсов Центра инновационных языковых технологий Дома дружбы народов Республики Коми, и составление экспертного листа для подведения итогов конкурса.
  14. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  15. Выступление на тему "Продвижение коми языка в электронном информационном пространстве" на международной конференции, организованной в Национальной библиотеке Республики Коми в рамках проведения Арктических Дельфийских игр.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.11.14 – 2022.11.18

опубликовал Öньö Лав в 20:09 17.11.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.11.14 – 2022.11.18

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  3. Сканирование и распознавание в программе ABBYY FineReader переводных книжных изданий "А. Мусатов. Стожары" (1950), "Г. Николаева. Вундандыр" (1952). По данным изданиям также созданы и заполнены wiki-cтраницы в онлайн справочнике "Коми тӧданін".
  4. Обработка в программе LibreOffice Writer (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) раннее распознанных коми текстов изданий "Н. Островский. Кыдзи калитчис сталь" (1955), "Н. Бирюков. Чайка" (1953), добавление данных текстов в корпус коми языка.
  5. Первичное выравнивание в программе WinMerge коми и русских текстов переводных изданий "Б. Житков. Кыдзи бать менӧ спасайтіс" (1952), "Н. Бирюков. Чайка" (1953), "Иван Франко. Рассказъяс" (1954), "А. Кононов. Сокольникиын ёлка" (1954), "С. Антонов. «Веж луг»" (1955 ), "Н. Островский. Кыдзи калитчис сталь" (1955), "С. Диковскӧй. «Смелӧй» катерлӧн приключениеяс" (1956), "Короленко В. Г. Кыв тӧдтӧг" (1956), "Л. Н. Толстой. Бӧрйӧм гижӧдъяс" (1957), "М. Шолохов. Мортлӧн судьба" (1958), "Михаил Шолохов. Лэптӧм эжа. 1 юкӧн" (1958), "А. Чумаченко. Тӧлысьвывса морт" (1958), "Н. Носов. Ичӧтик гажа семья" (1958), "Джек Лондон. Рассказъяс" (1958), "В. Бонч-Бруевич. Миян Ильич" (1959), "Анатолий Мошковский. Веж гыяс" (1961), "Виктор Баныкин. Чапаев йылысь висьтъяс" (1962), "Сергей Баруздин. Выль сикт" (1963), "Л. Воронкова. Звёздочкаса командир" (1963), "Г. Карпенко. Куим звӧнок" (1964), "Виктор Баныкин. Вильыш детинка" (1964), "А. Кононов. Смольнӧйын" (1966), "С. Виноградская. Юбиляр" (1969); включение данных текстов в параллельный корпус.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№46); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-27, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Добавление в виртуальную клавиатуру лексикографического ресурса dict.fu-lab.ru специфических символов тувинского алфавита: ң ө ү.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Проведение русскоязчыного вебинара для педагогов  на тему «Использование электронного ресурса "Портал для изучающих коми язык "Коми кыв"» в Коми республиканском институте развития образования.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
По сайту fu-lab.ru

опубликовал Öньö Лав в 10:44 15.11.2022

1. В виртуальную клавиатуру dict.fu-lab.ru просят добавть тувинские буквы: ң ө ү.
2. Просят создать пространство для селькупского языка на сайте fu-lab.ru (поддомен selkup.fu-lab.ru с вики-движком).

FU-Lab 2022.11.07 – 2022.11.11

опубликовал Öньö Лав в 22:46 10.11.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.11.07 – 2022.11.11

 

  1.  
  2. Сканирование и распознавание в программе FineReader переводных книжных изданий "Н. Бирюков. Чайка" (1953), "Д. Дэфо. Робинзон Крузо..." (1958), "Н. Островский. Кыдзи калитчис сталь" (1955), а также двуязычного издания "Туйводз-2" (2021). По данным изданиям также созданы и заполнены wiki-cтраницы в онлайн справочнике "Коми тӧданін".
  3. Первичное выравнивание в программе WinMerge коми текстов переводных изданий: "Иосиф Дик. Би шор" (1954), "Г. И. Успенский. Растеряевӧй улича вылын оланног" (1954), "Д. Дэфо. Робинзон Крузо..." (1958) с русскоязычными оригиналами; включение данных текстов в параллельный корпус.
  4. Продолжение выравнивания в программе WinMerge текстов русских переводов с коми оригиналами по изданиям "И. Торопов. Вам жить дальше" (1981) и "Иван Торопов. Тіянлы водзӧ овны" (1980) для корпуса параллельных текстов.
  5. Повторное тестирование нейросети по возможностям перевода для пары языков ru-kv на базе 300 000 выравненных предложений.
  6. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№45); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-22, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  8. Подписка на полный комплект электронных версий газет и журналов ГАУ РК "Издательский дом Коми" на 2023 год.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.10.31 – 2022.11.03

опубликовал Öньö Лав в 10:29 03.11.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.10.31 – 2022.11.03

  1.  
  2. Перевод с русского языка на коми язык текстов новостной ленты официального сайта администрации МОГО "Сыктывкар" для корпуса параллельных текстов.
  3. Продолжение перевода с русского языка на коми язык текстов учебного пособия "География Коми АССР" (1987) для корпуса параллельных текстов и образовательного портала "Коми мутӧдӧм".
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий: "Л. Н. Толстой. Хаджи Мурат" (1939), "С. Степняк-Кравчинскӧй. Андрей Кожухов" (1940), "И. Ликстанов. Малышок" (1950), "К. Д. Ушинскӧй. Висьтъяс да мойдъяс" (1952), "И. Карнаухова. Дружнӧйяс йылысь повесть" (1952), "А. С. Серафимович. Рассказъяс" (1954), "Ю. Сотник. Аддзывлытӧм лэбач" (1954) с русскоязычными оригиналами; включение данных текстов в параллельный корпус.
  5. Первичное выравнивание в программе WinMerge текстов русских переводов с коми оригиналами по изданиям  "И. Торопов. Вам жить дальше" (1981) и "Иван Торопов. Тіянлы водзӧ овны" (1980) для корпуса параллельных текстов.
  6. Первое тестирование нейросети по возможностям перевода для пары языков русский-коми на базе 200 000 параллельных предложений из кластера "Беллетристика".
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№44); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-16, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Improvement in our corpus

опубликовал Öньö Лав в 16:14 30.10.2022

Обдумать следующие предложения:

  • По умолчанию при выдаче игнорировать результаты, состоящие из одного слова или одного слова и цифры (набора цифр).
  • Добавить опцию поиска, при которой будут также выдаваться результаты с одним словом.
  • Добавить опцию поиска, включающего результаты из материала словарей (dict)
  • Добавть опцию поиска, включающего результаты из материала списков (list) и таблиц (table).

 

FU-Lab 2022.10.24 – 2022.10.28

опубликовал Öньö Лав в 20:42 27.10.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.10.24 – 2022.10.28

  1. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.
  2. Создание метаразметок для русскоязычных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" за 2000 и 2001 гг. и выравнивание коми и русских текстов для параллельного коми-русского корпуса.
  3. Первичное выравнивание в программе WinMerge коми текстов переводных изданий: "Дж. Лондон. Мексиканец" (1938), "А. С. Новиков-Прибой. Цусима" (1940), "Книга бӧрся книга. І" (1940), "Н. Никитин. Войвывса Аврора" (1953), "Д. Н. Мамин-Сибиряк. Висьтъяс" (1953) с русскоязычными оригиналами, а также коми оригинала по изданию "В. Юхнин. Биа нюр" (1952) с русским переводом.
  4. Распознавание в программе ABBYY FineReader русскоязчычного текста на старой орфографии издания "Дѣдушкино золото" (1912) для выравнивания с коми переводом.
  5. Модернизация коми переводов текстов издания "Книга бӧрся книга. І" (1940) для размещения в онлайн библиотеке "Коми гижӧд".
  6. Размещение в онлайн библиотеке "Коми гижӧд" текстов рассказа Д. Н. Мамина-Сибиряка "Дедлӧн зарни", сказок "Аладдин да шемӧс лампа", "Али-Баба да нелямын шыш" параллельно на коми и русском языках.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№43); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Оптимизация структуры таблицы выравненных и готовых к выравниванию текстов на вспомогательном wiki-ресурсе лаборатории.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-11, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  10. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12. Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
  14. Регистрация участников форума "Мы россияне".
2022ʼ йирымся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 14:21 22.10.2022

2022.09.26 - 2022.10.21

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации Ижемского района Республики Коми и начало перевода текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.  
  3. Распознавание в программе ABBYY FineReader русскоязчных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" за 2000 и 2001 гг. для дальнейшего выравнивания с соответствующими текстами коми переводов.    
  4. Выравнивание в программе WinMerge параллельных текстов официально-делового стиля на коми и русском языках из издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1998 №№ 7-12, 1999 №№1-12).
  5. Повторное выравнивание по предложениям в программе WinMerge параллельных текстов официально-делового стиля на коми и русском языках из издания "Ведомости нормативных актов органов государственной власти Республики Коми" (2017, 2018, 2019, 2020 гг.) после автоматической разбивки в новом парсере.
  6. Первичное выравнивание в программе WinMerge коми текстов с русскоязычными эквивалентами по переводным изданиям: "А. Гайдар. Барабанщиклӧн судьба" (1958), "Б. Горбатов. Покоритчытӧмъяс" (1945), "В. Катаев. Дӧлалӧ ӧтка еджыд парус" (1940), "К. Маркс, Ф. Энгельс. Коммунистическӧй партиялӧн манифест" (1948), "А. Кононов. Вернӧй сьӧлӧм" (1955), "М. Коршунов. Черёмушкиын керка" (1959), "В. Кочетов. Журбинъяс" (1956), "Л. Космодемьянская. Зоя да Шура йылысь повесть" (1952), "Л. Савельев. Зимний штурмуйтӧм" (1940), "М. Горький. Йӧзын" (1940), "М. Горький. Челядьдыр" (1939), "М. Горький. Менам университетъяс" (1948), "М. Горький. Мам" (1957), "М. Прилежаева. Ёртъясыд тэкӧд" (1952), "Н. Шундик. Ылі войвылын" (1956), "П. Кальма. Горчичнӧй райысь челядь" (1955), "Б. Полевой. Настоящӧй морт йылысь повесть" (1951), "А. П. Чехов. Канитель да мукӧд рассказъяс" (1956), "Э. Войнич. Овод" (1957), "Н. В. Гоголь Старосветскӧй помещикъяс" (1939), "Ванда Василевская. Радуга" (1944), "Е. Кошевая. Пи йылысь повесть" (1951), "Ф. Вигдорова. Менам класс" (1951) , "Елена Ильина. Нёльӧд высота" (1951) , "Вера Панова. Яснӧй берег" (1952), "Н. В. Гоголь. Повесть сы йылысь, кыдзи Иван Иванович пиньӧ воис Иван Никифоровичкӧд" (1952) , "А. Фадеев. Молодая гвардия" (1953), "Л. Н. Толстой. Кавказскӧй пленник" (1953) , "М. Лермонтов. Миян кадся герой" (1953) , "Сергей Розанов. Травкалӧн приключениеяс" (1953) , "В. Осеева. Васёк Трубачёв да сылӧн ёртъясыс. Коймӧд книга" (1953), "Вадим Собко. Мирлӧн залог" (1955).
  7. Разбивка на предложения коми и русских текстов новостной ленты Официального портала Республики Коми с марта 2001 по сентябрь 2022 г.,  повторное выравнивание оригиналов и переводов в программе WinMerge.
  8. Добавление выравненных за месяц текстов на русском и коми языках в параллельный корпус.
  9. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (№№39-42), журналов "Йӧлӧга" (2022. №№7, 8, 9) и "Войвыв кодзув" (2022. №№6, 7); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.    
  10. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-03, 1925-01-07 и 1925-01-10, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".    
  11. Добавление в онлайн-библиотеку "Коми гижӧд" текста учебника "Гурвиц Ю. О., Гангнус Р. В. Медводдза сведенньӧяс геометрияысь" (1934) в переводе на современную графику.
  12. Сборка, метаразметка, обработка в программе gedit (унификация кавычек, тире и дефисов, замена латинских ӧ и і коми эквивалентами, устранение лишних пробелов) и загрузка в коми-пермяцкий раздел корпуса коми языка текстового контента онлайн-ресурса "Велӧтісь".
  13. Создание и отлаживание онлайн сервиса для стандартизации параллельных текстов, подготавливаемых для анализа в нейросети.
  14. Внесение изменений в список исключений и добавление условий в программу разбивки параллельных текстов на предложения.
  15. Создание веб-ресурса для максимальной парцелляции и окончательной обработки параллельных текстов перед загрузкой в базу нейросети.
  16. Создание wiki-страниц по свежим номерам журнала "Войвыв кодзув" на сайте "Коми тӧданін"   
  17. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  18. Проведение вебинара для воспитателей на тему «Дополнительный онлайн-инструментарий в процессе обучения коми языку» в Коми республиканском институте развития образования. (14 октября 2022 г.).
  19. Проведение вебинара для учителей  на тему «Основные разделы корпуса коми языка, особенности настройки поиска и сортировки при работе с корпусом» в Коми республиканском институте развития образования. (~20 октября 2022 г.).
  20. Семинар с  магистрантами-регионоведами Сыктывкарского государственного университета им Питирима Сорокина по теме "Основные продукты лаборатории FU-Lab и возможности их использования". (19 октября 2022 г.)
  21. Выступление с сообщением на тему "Новые онлайн ресурсы для научного изучения коми языка" на XIX Международном симпозиуме "Диалекты и история пермских языков во взаимодействии с другими языками". (21 октября 2022 г.).
  22. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  23. Распространение комиязычного контента в соц. сетях.
  24. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.10.17 – 2022.10.21

опубликовал Öньö Лав в 0:16 21.10.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.10.17 – 2022.10.21

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации  МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.  
  3. Распознавание в программе ABBYY FineReader русскоязчыных текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (2001. №№1-12) для дальнейшего выравнивания с соответствующими текстами коми переводов.
  4. Первичное выравнивание в программе WinMerge коми текстов переводных изданий с русскоязычными эквивалентами: "Ванда Василевская. Радуга" (1944), "Е. Кошевая. Пи йылысь повесть" (1951), "Ф. Вигдорова. Менам класс" (1951) , "Елена Ильина. Нёльӧд высота" (1951) , "Вера Панова. Яснӧй берег" (1952), "Н. В. Гоголь. Повесть сы йылысь, кыдзи Иван Иванович пиньӧ воис Иван Никифоровичкӧд" (1952) , "А. Фадеев. Молодая гвардия" (1953), "Л. Н. Толстой. Кавказскӧй пленник" (1953) , "М. Лермонтов. Миян кадся герой" (1953) , "Сергей Розанов. Травкалӧн приключениеяс" (1953) , "В. Осеева. Васёк Трубачёв да сылӧн ёртъясыс. Коймӧд книга" (1953), "Вадим Собко. Мирлӧн залог" (1955).
  5. Добавление в параллельный корпус  выравненных за минувшую неделю текстов.
  6. Создание веб-ресурса для максимальной парцелляции и окончательной обработки параллельных текстов перед загрузкой в базу нейросети.
  7. Извлечение из pdf файлов текстов свежего номера газеты "Коми му" (№42); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1926-01-10, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  9. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Проведение вебинара для учителей  на тему «Основные разделы корпуса коми языка, особенности настройки поиска и сортировки при работе с корпусом» в Коми республиканском институте развития образования.
  12. Семинар с  магистрантами-регионоведами Сыктывкарского государственного университета им Питирима Сорокина по теме "Основные продукты лаборатории FU-Lab и возможности их использования".
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.10.10 – 2022.10.14

опубликовал Öньö Лав в 21:30 13.10.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.10.10 – 2022.10.14

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации Ижемского района Республики Коми и начало перевода текстов официального сайта администрации МОГО "Сыктывкар" для коми локализации и корпуса параллельных текстов.  
  3. Повторное выравнивание по предложениям в программе WinMerge параллельных текстов официально-делового стиля на коми и русском языках из издания "Ведомости нормативных актов органов государственной власти Республики Коми" (2017, 2018, 2019, 2020 гг.) после автоматической разбивки в новом парсере.
  4. Распознавание в программе ABBYY FineReader русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (2000. №№1-12) для дальнейшего выравнивания с соответствующими текстами коми переводов.
  5. Первичное выравнивание в программе WinMerge коми текстов переводных изданий: "Б. Полевой. Настоящӧй морт йылысь повесть" (1951), "А. П. Чехов. Канитель да мукӧд рассказъяс" (1956), "Э. Войнич. Овод" (1957), "Н. В. Гоголь Старосветскӧй помещикъяс" (1939).
  6. Добавление в параллельный корпус  выравненных за минувшую неделю текстов.
  7. Добавление в онлайн-библиотеку "Коми гижӧд" текста учебника " Гурвиц Ю. О., Гангнус Р. В. Медводдза сведенньӧяс геометрияысь" (1934) в переводе на современную графику.
  8. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (№41) и журнала "Войвыв кодзув" (2022. №№6-7); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Создание wiki-страниц по свежим номерам журнала "Войвыв кодзув" на сайте "Коми тӧданін"
  10. Создание и отлаживание онлайн сервиса для стандартизации параллельных текстов, подготавливаемых для анализа в нейросети.
  11. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  12. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Проведение вебинара  на тему «Дополнительный онлайн-инструментарий в процессе обучения коми языку» в Коми республиканском институте развития образования.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.10.03 – 2022.10.07

опубликовал Öньö Лав в 7:32 07.10.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.10.03 – 2022.10.07

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов официального сайта администрации Ижемского района Республики Коми для коми локализации и корпуса параллельных текстов.  
  3. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022. №39, 40) и журнала "Йӧлӧга" (2022. №7, 8, 9), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  4. Разбивка на предложения коми и русских текстов новостной ленты Официального портала Республики Коми с марта 2001 по сентябрь 2022 г.,  повторное выравнивание оригиналов и переводов в программе WinMerge.
  5. Добавление в параллельный корпус  выравненных за три последних недели текстов переводной художественной литературы и новостной ленты rkomi.ru.
  6. Внесение изменений в список исключений и добавление условий в программу разбивки параллельных текстов на предложения.
  7. Сборка, метаразметка, обработка в программе gedit (унификация кавычек, тире и дефисов, замена латинских ӧ и і коми эквивалентами, устранение лишних пробелов) и загрузка в коми-пермяцкий раздел корпуса коми языка текстового контента онлайн-ресурса "Велӧтісь".
  8. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1925-01-03  и 1925-01-07, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  9. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.09.26-2022.09.30

опубликовал Öньö Лав в 11:32 30.09.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.09.26-2022.09.30.

  1.  
  2. Выравнивание в программе WinMerge параллельных текстов официально-делового стиля на коми и русском языках из издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1998 №№ 7-12, 1999 №№1-12).
  3. Первичное выравнивание в программе WinMerge коми текстов переводных изданий: "А. Гайдар. Барабанщиклӧн судьба" (1958), "Б. Горбатов. Покоритчытӧмъяс" (1945), "В. Катаев. Дӧлалӧ ӧтка еджыд парус" (1940), "К. Маркс, Ф. Энгельс. Коммунистическӧй партиялӧн манифест" (1948), "А. Кононов. Вернӧй сьӧлӧм" (1955), "М. Коршунов. Черёмушкиын керка" (1959), "В. Кочетов. Журбинъяс" (1956), "Л. Космодемьянская. Зоя да Шура йылысь повесть" (1952), "Л. Савельев. Зимний штурмуйтӧм" (1940), "М. Горький. Йӧзын" (1940), "М. Горький. Челядьдыр" (1939), "М. Горький. Менам университетъяс" (1948), "М. Горький. Мам" (1957), "М. Прилежаева. Ёртъясыд тэкӧд" (1952), "Н. Шундик. Ылі войвылын" (1956), "П. Кальма. Горчичнӧй райысь челядь" (1955) с аналогичными текстами на русском языке.
  4. Переговоры по размещению ненецких словарей на лексикографическом сайте "Онлайн словари FU-Lab".
  5. Распространение комиязычного контента в соц. сетях.
  6. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ вося куим кварталысь отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 13:31 19.09.2022

=================3. Создание новых продуктов - 3 (в процессе):

 

1.  Локализация сайтов.

1.1. Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам МО ГО Сыктывкар,  Сысольского, Усть-Куломского, Ижемского и Печорского районов.

1.2. Перевод с русского языка на коми язык текстов сайтов администраций Сысольского (338813 зн.), Ижемского (665161 зн.), Печорского (39939 зн.) и Усть-Куломского районов (296831 зн.) Республики Коми для коми локализации и корпуса параллельных текстов.
1.3. Начало выравнивания коми перевода текстов официальных сайтов Сысольского и Усть-Куломского  районов с текстами на языке оригинала в программе WinMerge.

 

2. Локализация программ.

2.1. Работы по локализации приложений операционной системы Simply Linux.

2.2. Перевод на коми язык глоссария данной ОС, предоставленного разработчиком (2139 строк).

 

3. Продолжение работы в рамках создания параллельного корпуса (kv-ru) для коми-русского и русско-коми переводчика:

3.1. Создание параллельного корпуса официальных текстов.

3.1.1. Распознавание в программе ABBYY FineReader русскоязычного контента издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996-1999) для корпуса параллельных текстов. Создание (797 ед.) метаразметок к текстам документов; разбивка коми и русских текстов на предложения и выравнивание русских оригиналов с коми переводом текстов за 1996-1998 гг.

3.1.2. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2021 – сентябрь 2022 года; выравнивание коми и русского эквивалента в программе WinMerge. (6786 строк).

3.2. Параллельный корпус текстов радионовостей.

3.2.1. Перевод с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. (240991 зн.) и 2019 г. (223948 зн.).

3.2.2. Сборка новостных текстов радио "Коми гор" за 2018, 2019 и 2020 гг. и создание метаразметок к текстам.  Выделение в отдельный файл русскоязычного контента  для дальнейшего выравнивания с коми эквивалентом.

3.2.3. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.

3.2.4. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".

3.3. Выравнивание коми и русских текстов других форм.

3.3.1. Создание общих файлов tran_ru.txt и tran_kv.txt по собранным в 2021 году параллельным текстам художественной литературы на коми и русском языках, выравнивание строк в текстах указанных файлов в программе WinMerge. (84667 строк).

3.3.2. Создание файлов nt_ru.txt  и nt_kv.txt c текстами Нового завета на коми и русском языках (предварительное устранение нумерации, несовпадающих заголовков и т. п., унификация формата в программе gedit), выравнивание текстов на двух языках в программе WinMerge. (9014 строк).

3.3.3. Сбор русскоязычного материала сайта "Изьватас" и его выравнивание с коми переводом для корпуса параллельных текстов. (1073 строк).

3.3.4. Выравнивание вновь переведенных текстов из учебника географии для 7 класса (2012) с русским оригиналом для корпуса параллельных текстов.
3.3.5. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии,  метаразметка) русскоязычных оригиналов изданий "В. А. Тетюрев. Естествознание. 3 класс" (1940),  "В. А. Тетюрев. Естествознание. 4 класс" (1940),  "М. Н. Скаткин. Природоведение. 4 класс"  (1968), "Л. Г. Терехова, В.Г . Эрдели. География. 3 класс" (1938), "Л. Г. Терехова, В. Г. Эрдели. География. 4 класс" (1938), "И. Г. Иванов. География частей света и важнейших стран (без СССР)" (1935), "П. Н. Счастнев, П. Г. Терехов. География частей света: учебник для 6 класса" (1959). Выравнивание коми переводов с русскими оригиналами в программе WinMerge и включение текстов в парралельный корпус.
3.3.6. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer  (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) коми и русских текстов двуязычного издания "Шӧвк тупыль" (2012); выравнивание в программе WinMerge коми оригинала с русским переводом и включение текстов в парралельный корус.   
3.3.7. Выравнивание коми переводных текстов "А. Авдеенко. Гӧраясын тулыс" (1959) и  "На пороге юности" (1959)  с русским оригиналом в программе WinMerge и включение текстов в парралельный корус.
3.3.8. Поиск и сбор для параллельного корпуса дополнительных оригиналов крупных художественных произведений, имеющих перевод на коми язык.
3.4. Перевод коми текстов на русский язык для корпуса параллельных текстов.
3.4.1. Перевод текстов газеты "Коми му" (2022 №32) с коми языка на русский язык (24476 знаков).
3.5. Создание онлайн сервиса корпуса параллельных текстов.
3.5.1. Разработка структуры онайн сервиса корпуса параллельных текстов на русском и коми языках и создание первой версии параллельного корпуса.
3.5.2. Дополнение списка исключений и добавление условий в программу разбивки параллельных текстов на предложения в онлайн сервисе корпуса параллельных текстов.
3.5.3. Разработка опции тематической разбивки в онайн сервисе корпуса параллельных текстов.


==============4. Пополнение и модернизация существующих электронных ресурсов - 12, в том числе:

 

1. Текстовое пополнение и оптимизация Корпуса коми языка:

1.1. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996 №11, 2002. №№1-5), книг О. И. Уляшев. "Кад пыр верзьӧмӧн" (2019), О. И. Уляшев. "Зарни бобув" (2021), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), "М.Н. Скаткин. Природоведение. 4 кл." (1962), сборника "Вын" (2022) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе  ABBYY FineReader и создание pdf файлов.

1.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6, 8, 11).

1.3. Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного контента издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2001), текстов журналов "Войвыв кодзув"  (1962 №1) и  "Ударник" (1940 №№1-12), газеты "Колхозный труд" (май-сентябрь 1943 года), книг О. И. Уляшев "Зарни бобув" (2021), Е. А. Игушев.  "Коми кывлӧн стилистика" (2003), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000)‎‎, "Вильышпоз" (2000), и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".

1.4. Обработка (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) ранее распознанных текстов: К. Королёв. "Важ нэмъяслӧн гусяторъяс" (2006) и №№2-12 журнала "Войвыв кодзув" за 1962 год;

1.5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№1-38), журналов "Войвыв кодзув" (2021 №№10-12, 2022. №№1-5) и "Йӧлӧга" (2021 №12, 2022 №1-6), а также текстов двух номеров газеты "Выль туйӧд" за 2011 год (2011-01-05, 2011-01-14); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
1.6. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986),  их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
1.7. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) текста издания "М. Н. Скаткин. Природоведение. 4-ӧд класслы учебник" (1962), текстов номеров газет "Водзӧ" за январь 1946 года и  "Выль Войвыв" за март-декабрь 1956 года.

1.8. Вычитка и корректирование уникальных художественных текстов журнала "Войвыв кодзув" (№№ 7, 8, 11, 12 за 1975 г.),  текстов произведений В. Юхнина, И. И. Пыстина (публицистические, литературоведческие, драматические произведения, переводы), Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988) и "Коми кывйыс гажаджык на биысь" (1998).

1.9. Сравнение и корректирование в программе Meld редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.) и произведений И. И. Пыстина, имеющих разные редакции.

1.10. Обработка текстов новостной ленты официальных порталов Республики Коми на коми языке за декабрь 2021 - сентябрь 2022 года (метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell).

1.11. Текущие исправления возникающих технических проблем функционирования корпуса.

1.12. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса. Объем корпуса на 23.09.2022 - 75 592 783 словоупотреблений.
1.13. Систематизация pdf файлов с номерами газеты "Выль туйӧд" за 2011, 2013-2017 гг., полученных от редакции газеты.

 

2. Текстовое пополнение молодцовского и латинского корпуса:

2.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов)  и добавление в молодцовский корпус текстов 65 комиязычных номеров газеты "Југыԁ туј" за 1924 г.

2.2. Сканирование и обработка в программе ABBYY FineReader сканов, создание pdf копий книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).
2.3. Сканирование ксерокопий дополнительных комиязычных номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, сделанных в Национальной библиотеке Республики Коми.
2.4. Создание фотокопий альманахов "Комі каԉенԁар" за 1923 и 1924 гг. в Национальном архиве Республики Коми.
2.5. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1921).
2.6. Корректура оригинальных текстов изданий "1922. Комі јӧзлы каԉенԁар" (1921), "Войвыв край овмӧс йылысь очеркъяс" (1932), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932), "Кӧрым ԍілосујтӧмын отсӧг" (1932) и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932).
2.7. Распознавание и вычитка в программе ABBYY FineReader  текстов на молодцовице изданий "Поԉарнӧј похоԁ Краԍінӧн" (1930) и "Комі облаԍтлы ԁасвіт во" (1936).  
2.8. Распознавание и вычитка в программе ABBYY FineReader, корректирование с помощью латинского/молодцовского спеллера в программе LibreOffice Writer текстов на коми латинице из изданий "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и на молодцовице из изданий "Комі каԉенԁар" за 1923 и 1924 гг., "Вотјас" (1923), "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936).
2.9. Перевод на современную графику, вычитка и корректирование в программе LibreOffice Writer текстов изданий 1932 года: "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ",  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын", "Важ јӧзлӧн історіја".  
2.10. Загрузка в молодцовский (либо латинский) корпус текстов альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг., книжных изданий "Вотјас" (1923), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932)‎‎, "Кӧрым ԍілосујтӧмын отсӧг" (1932)‎‎, "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932)‎‎, "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932)‎‎, "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Войвыв край овмӧс йылысь очеркъяс" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Важ јӧзлӧн історіја" (1932), "Fiⱬiçeskəj geografija" (1933), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934), "В. А. Ԏеԏурев. Јесԏествознаԋіје. Первојја чаԍт" (1935),  "В. А. Ԏеԏурев. Јесԏествознаԋіје. Мӧԁ чаԍт (1935)", "Л. Г. Ԏерехова ԁа В. Г. Ерԁеԉі.  Географіја. Первојја чаԍԏ. Начаԉнӧј школаса којмӧԁ класслы учебԋік (1936)", "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "Г. І. Іванов. Географіја свет јукӧнјаслӧн ԁа меԁтӧԁчана странајаслӧн (СССР-тӧг)" (1936).
2.11. Регулярное обновление корпуса. Объем корпуса на 23.09.2022 -  2 344 112 словоупотреблений.

 

3. Создание и пополнение коми-пермяцкого корпуса

3.1. Создание коми-пермяцкого раздела корпуса коми языка на основе текстов оригинальной художественной литературы (1921-2004 гг.).

3.2. Пополнение коми-пермяцкого корпуса текстами еженедельника "Кама кытшын" за 2019-22 гг.,  комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг., переводов на коми-пермяцкий язык по изданиям 1940-60 гг.,  учебников 1930-40 гг. и готовыми текстами молодцовского и латинского периода на современной графике. Метаразметка текстов.

3.3. Распознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932).

3.4. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
3.5. Извлечение из pdf файлов текстов коми-пермяцкого журнала "Лов шы" (2020-21) их обработка в программе LibreOffice (выравнивание абзацев, метаразметка, расстановка языковых тэгов) и загрузка в коми-пермяцкий корпус.
3.6. Регулярное обновление корпуса. Объем на 23.09.2022 -  6 172 413 словоупотреблений.

 

4. Пополнение онлайн библиотеки "Коми гижӧд":

4.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников.

4.2. Размещение в онлайн библиотеке текстов произведений В. Юхнина по изданиям "Висьтъяс да очеркъяс" (1961), "Дінъёльса вӧрпункт" (1983), "Герой йылысь сказ" (1945), а также текстов того же автора, опубликованных в журналах "Войвыв кодзув" и "Ударник".
4.3. Обработка текстов произведений и переводов  И. И. Пыстина  (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций; выравнивание абзацев, исправление орфографии старых изданий на современную орфографию) и размещение данных текстов в онлайн библиотеке "Коми гижӧд".

4.4. Размещение в онлайн библиотеке текстов произведений Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988), "Коми кывйыс гажаджык на биысь" (1998) и "Коми кывлӧн стилистика" (2003).
4.5. Перевод на современную графику текстов книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и  "Войвыв край овмӧс йылысь очеркъяс" (1932), а также альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг.; их повторная вычитка и размещение в онлайн библиотеке "Коми гижӧд" параллельно с текстами на оригинальной графике.
4.6. Повторная вычитка на современной графике текстов книжных изданий "Вотјас" (1923), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Важ јӧзлӧн історіја" (1932),  "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и  их размещение в онлайн библиотеке "Коми гижӧд" параллельно на современной и оригинальной графике.
4.7. Добавление текстов изданий 1932 года на  молодцовице "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" в онлайн библиотеку "Коми гижӧд" параллельно к ранее размещенным редакциям на современной графике.

4.8. Размещение в Коми онлайн библиотеке произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".

4.9. Размещение в онлайн библиотеке всех текстов комиязычных номеров газеты "Југыԁ туј" за январь-декабрь 1924 года в переводе на современную графику.

4.10. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).

4.11. За отчетный период количество текстов в библиотеке возросло на 1819 единиц.

 

5. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

5.1. Создание и заполнение информационных wiki-страниц по 23 изданиям: "Дневник Николая Фёдоровича Терентьева" (2021), "Долыд олан кад" (1997), "Ӧтисянь дасӧдз" (2000), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005),  "Вильышпоз" (2000) , "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), "М. А. Кастрен — Сибир туялысь (2014)"; "М. Н. Скаткин. Природоведение : 4-ӧд класслы учебник" (1962, "Тӧвся Дуда (Е. Афанасьевалӧн 2022' вося небӧг)", "Челядьдырӧй, сё майбырӧй! (Э. И. Поляковалӧн 2022' вося небӧг)", "Аська, Петрушка, Тришка да мукӧд (2022' вося небӧг)", "Войвывса календар. Северный календарь (А. Сукгоевалӧн 2022' вося небӧг)", "Кӧні быдмӧ маръямоль. Где растёт маръямоль (А. Сукгоевалӧн 2022' вося небӧг)", "Ӧтисянь дасӧдз (2000ʼ вося небӧг)", "География (гырысьяслы, 1936’ вося небӧг)"‎‎, "Газетнӧй лист: электрическӧй опытъяс (1933ʼ вося небӧг)", "География (4-ӧд класслы, 1939ʼ вося небӧг)", "1922 – сюрс ӧкмыссё кызь кыкӧд во (1922ʼ вося небӧг)", "Коми календар. 1923" и "Коми календар. 1924"; пополнение библиографии на страницах авторов данных изданий.

5.2. Создание информационных wiki-страниц с содержанием 65 комиязычных номеров газеты "Југыԁ туј" за 1924 год с добавлением ссылок на тексты статей из этих номеров, размещенные в онлайн-библиотеке "Коми гижӧд".
5.3. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
5.4. Создание и заполнение отдельных wiki-страниц по произведениям И. И. Пыстина, имеющих разные редакции.

5.5. Добавление ссылок на произведения, размещенные в онлайн-библиотеке "Коми гижӧд", с wiki-страниц авторов Е. А. Игушев, В. Лодыгин и В. Юхнин, А. Шомысова, И. Пыстин.
5.6. Внесение информации о корректуре на wiki-страницы, посвященных обработанным номерам издания  "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. и №№2-12 журнала "Войвыв кодзув" за 1962 год, а также книжных изданий: Фіԅіка. 2-ӧд юкӧн" (1932), "Војвыв крај овмӧс јылыԍ очеркјас" (1932), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932), "Кӧрым ԍілосујтӧмын отсӧг" (1932) и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932),  "Важ јӧзлӧн історіја" (1932), "Шӧвк тупыль" (2012), "А. Ԋечајев. Географія : І ст. школаса ІІІ-ӧԁ волы" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и "Вотјас" (1923).

5.7. Добавление изображений на страницы wiki-ресурса "Коми тӧданін", посвященные отдельным изданиям (+10).

5.8. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".

5.9. Пополнение библиографии периодики содержанием номеров газеты «Коми му» (2021 № 39-52, 2022 №1-26) и журнала «Йӧлӧга» (2021  № 9-12, 2022 №1-8).

5.10. Дополнение указателя комиязычных публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г.,  №№1-12 за 2021 гг., №№1, 2 за 2022 гг.
5.11. Создание ссылок со страниц изданий на страницы авторов и наоборот.
5.12. Пополнение погодовых списков книжных изданий, создание ссылок на новые страницы.

 

6. Пополнение лексической базы FU-Lab:

6.1. Сортировка объединенного списка названий организаций и учреждений, созданного по материалам выполненных заявок БОП за 2012–2021 гг.; обработка общего списка (устранение вновь выявленных повторов, уточнение названий по данным официальных сайтов), создание разметки xml и загрузка "Русско-коми словаря названий организаций и учреждений" (3224 словарные статьи) на сайт Онлайн словари FU-Lab, редактирование онлайн версии словаря, унификация подачи аналогичных случаев.

6.2. Сбор и перевод на коми язык дополнительных названий республиканских и муниципальных учреждений и организаций  Республики Коми, а также названий их отделов и филиалов, не попавших в список, составленный по материалам выполненных заявок БОП за 2012–2021 гг.

6.3. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".

6.4. Выработка предложений для Коми РТОК по отдельным проблемам перевода.
6.5. Работа по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.

 

7. Пополнение образовательного портала "Коми кыв"

7.1. Размещение на wiki-ресурсе образовательного портала "Коми кыв" текстов методических материалов О. И. Рочевой (6 изданий).

7.2. Сегментация в программе Sound Forge аудиматериала учебников Е. Н. Вязовой и  А. В. Сизовой "Коми кыв" для 3 и 4 классов, привязка аудио к текстам учебника на сайте http://audio.komikyv.ru.

7.3. Создание и обработка (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) для образовательного портала "Коми кыв", начало работы по добавлению к разговорнику аудиоматериала.

7.4. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.

 

8. Пополнение лингвистического сайта "Коми кыв"

8.1. Создание и обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".

8.2. Размещение информационных материалов, освящающих события в секторе языка ИЯЛИ ФИЦ "КНЦ УрО РАН".

 

9. Пополнение образовательного сайта "Коми география":

9.1. Продолжение перевода текста учебника географии для 7 класса (2012),  редактирование новых разделов и их размещение на сайте "Коми мутӧдӧм".
9.2. Создание модернизированных версий текстов по географии из изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и  "Fiⱬiçeskəj geografija" (1933)  и размещение обновленных текстов на портале "Коми мутӧдӧм".
9.3. Выравнивание в программе WinMerge и сравнение в программе Meld конгруэнтных коми текстов разных изданий учебников по естествознанию для 3-4 классов (1935 и 1940) и географии для 3 класса (1936 и 1939).

 

10. Пополнение коми аудиокорпуса:

10.1. Добавление в аудиобазу лаборатории файлов с выпусками радиопередачи "Миян кад" за ноябрь-декабрь 2021 г. и аудиофайлов с художественными текстами, предоставленными С. Г. Горчаковой.

 

11. Пополнение словарной базы средства проверки правописания Hunspell:

11.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение отчетного периода.

11.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11.3. Обновление лексической базы коми (вариативного) спелера в Онлайн-сервисе проверки орфографии

 

12. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru

12.1. Добавление сервиса построчного сравнения файлов.

12.2. Добавление сервиса создания tmx-файлов.


+Распространение комиязычного контента в соц. сетях.

 

+Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

 

+Участие в мероприятиях:

 

  1. Участие в мероприятии «Ӧтувъя коми диктант» (2022.02.21).
  2. Выступление на межрегиональной научно-практической онлайн конференции "Диалог культур — ценность гражданско-патриотического воспитания". (Пермь-Кудымкар-Кочево, 17.02.2022) с информацией о комплексе комиязчычных онлайн ресурсов и перспективах его расширения за счет коми-пермяцкого материала.
  3. Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ, 2022.04.22).
  4. Участие в  zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
  5. Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).
  6. Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).
  7. Проведение пяти вебинаров в Коми республиканском институте развития образования:
    1. "Порядок установки и особенности функционирования коми раскладкок клавиатуры" (2022.01.27)
    2. "Особенности функционирования и возможностями использования онлайн библиотеки "Коми гижӧд" (2022.03.16).
    3. "Использование образовательного портала "Коми кыв" в процессе обучения коми языку" (2022.03.17).
    4. "Автоматическая проверка правописания в процессе обучения коми языку" (2022.04.15)
    5. "Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022.06.23).
  8.  Участие в подписании соглашения о взаимодействии с Национальной библиотекой РК (2022.07.05).
  9.  Участие в мероприятии "Достояние Севера-2022"; в рамках подготовки к мероприятию составлена Google-презентация по продуктам лаборатории FU-Lab (2022.08.27).

 

2022ʼ коймӧд квартался отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 20:06 15.09.2022

2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и государственных учреждений Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Начало выравнивания коми перевода текстов официальных сайтов Сысольского и Усть-Куломского  районов с текстами на языке оригинала в программе WinMerge.
2.3. Сборка текстов новостной ленты официального портала РК на коми и русском языках за март-сентябрь 2022 года, обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов), выравнивание оригинала с переводом в программе WinMerge.
2.4. Создание метаразметок для русскоязычных текстов журналов "Ведомости нормативных актов органов государственной власти Республики Коми" от 1996 (№№ 1-12), 1997 (№№ 1-12), 1998 (№№ 1-12) и 1999 (№№ 1-12) годов; разбивка коми и русских текстов на предложения и выравнивание русских оригиналов с коми переводом текстов за 1996-1998 гг.
2.5. Перевод текстов газеты "Коми му" (2022 №32) с коми языка на русский язык для корпуса параллельных текстов.
2.6. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии,  метаразметка) русскоязычных оригиналов изданий "В. А. Тетюрев. Естествознание. 3 класс" (1940),  "В. А. Тетюрев. Естествознание. 4 класс" (1940),  "М. Н. Скаткин. Природоведение. 4 класс"  (1968), "Л. Г. Терехова, В.Г . Эрдели. География. 3 класс" (1938), "Л. Г. Терехова, В. Г. Эрдели. География. 4 класс" (1938), "И. Г. Иванов. География частей света и важнейших стран (без СССР)" (1935), "П. Н. Счастнев, П. Г. Терехов. География частей света: учебник для 6 класса" (1959). Выравнивание коми переводов с русскими оригиналами в программе WinMerge.
2.7. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer  (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) коми и русских текстов двуязычного издания "Шӧвк тупыль" (2012); выравнивание в программе WinMerge коми оригинала с русским переводом.   
2.8. Выравнивание коми переводных текстов "А. Авдеенко. Гӧраясын тулыс" (1959) и  "На пороге юности" (1959)  с русским оригиналом в программе WinMerge.
2.9. Разработка структуры корпуса параллельных текстов на русском и коми языках и создание первой версии параллельного корпуса.
2.10. Дополнение списка исключений и добавление условий в программу разбивки параллельных текстов на предложения.
2.11. Разработка опции тематической разбивки в корпусе параллельных текстов.
2.12. Включение выравненных пар текстов (ru-kv), указанных в пп. 2.3, 2.6, 2.7 и 2.8 в корпус параллельных текстов.
2.13. Поиск и сбор для параллельного корпуса дополнительных оригиналов крупных художественных произведений, имеющих перевод на коми язык.
2.14. Продолжение работы над локализацией приложений операционной системы Simply Linux и перевода на коми язык глоссария данной ОС, предоставленного разработчиком.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Сканирование, обработка сканов в программе ABBYY FineReader и создание pdf-копии комиязычного издания "М.Н. Скаткин. Природоведение. 4 кл." (1962).
3.2. Систематизация pdf файлов с номерами газеты "Выль туйӧд" за 2011, 2013-2017 гг., полученных от редакции газеты.
3.3. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му"  (2022. №26-38) и  журнала "Йӧлӧга" (2022 №6), а также текстов двух номеров газеты "Выль туйӧд" за 2011 год (2011-01-05, 2011-01-14); обработка указанных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
3.4. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) текста издания "М. Н. Скаткин. Природоведение. 4-ӧд класслы учебник" (1962), текстов номеров газет "Водзӧ" за январь 1946 года и  "Выль Войвыв" за март-декабрь 1956 года.
3.6. Включение  в корпус коми языка коми текстов изданий "А. Авдеенко. Гӧраясын тулыс" (1959), "М. Н. Скаткин. Природоведение. 4-ӧд класслы учебник" (1962), "Шӧвк тупыль" (2012), свежих номеров газеты "Коми му" (2022. №35-38) и  журнала "Йӧлӧга" (2022 №6), номеров газет "Водзӧ" за январь 1946 года и  "Выль Войвыв" за март-декабрь 1956 год, а также коми текстов официального портала РК за март-сентябрь 2022 г.
3.7. Замена в корпусе коми языка текстов произведений и переводов И. И. Пыстина откорректированными вариантами.
3.8. Еженедельное обновление корпуса.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Сканирование и обработка в программе ABBYY FineReader сканов, создание pdf копий книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).
4.2. Сканирование ксерокопий дополнительных комиязычных номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, сделанных в Национальной библиотеке Республики Коми.
4.3. Создание фотокопий альманахов "Комі каԉенԁар" за 1923 и 1924 гг. в Национальном архиве Республики Коми.
4.4. Корректура оригинальных текстов изданий "1922. Комі јӧзлы каԉенԁар" (1921), "Войвыв край овмӧс йылысь очеркъяс" (1932), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932), "Кӧрым ԍілосујтӧмын отсӧг" (1932) и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932).
4.5. Распознавание и вычитка в программе ABBYY FineReader  текстов на молодцовице изданий "Поԉарнӧј похоԁ Краԍінӧн" (1930) и "Комі облаԍтлы ԁасвіт во" (1936).  
4.6. Распознавание и вычитка в программе ABBYY FineReader, корректирование с помощью латинского/молодцовского спеллера в программе LibreOffice Writer текстов на коми латинице из изданий "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и на молодцовице из изданий "Комі каԉенԁар" за 1923 и 1924 гг., "Вотјас" (1923), "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936).
4.7. Перевод на современную графику, вычитка и корректирование в программе LibreOffice Writer текстов изданий 1932 года: "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ",  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын", "Важ јӧзлӧн історіја".  
4.8.  Загрузка в молодцовский (либо латинский) корпус текстов альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг., книжных изданий "Вотјас" (1923), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932)‎‎, "Кӧрым ԍілосујтӧмын отсӧг" (1932)‎‎, "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932)‎‎, "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932)‎‎, "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Войвыв край овмӧс йылысь очеркъяс" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Важ јӧзлӧн історіја" (1932), "Fiⱬiçeskəj geografija" (1933), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934), "В. А. Ԏеԏурев. Јесԏествознаԋіје. Первојја чаԍт" (1935),  "В. А. Ԏеԏурев. Јесԏествознаԋіје. Мӧԁ чаԍт (1935)", "Л. Г. Ԏерехова ԁа В. Г. Ерԁеԉі.  Географіја. Первојја чаԍԏ. Начаԉнӧј школаса којмӧԁ класслы учебԋік (1936)", "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "Г. І. Іванов. Географіја свет јукӧнјаслӧн ԁа меԁтӧԁчана странајаслӧн (СССР-тӧг)" (1936), а также текстов номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-10-18, 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16, 1924-12-18, 1924-12-20, 1924-12-23, 1924-12-26, 1924-12-27 и 1924-12-30.

5. Работа над пополнением коми-пермяцкого корпуса:

5.1. Извлечение из pdf файлов текстов коми-пермяцкого журнала "Лов шы" (2020-21) их обработка в программе LibreOffice (выравнивание абзацев, метаразметка, расстановка языковых тэгов) и загрузка в коми-пермяцкий корпус.
5.2. Пополнение коми-пермяцкого корпуса интернет-контентом за июль-сентябрь 2022 г.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Обработка текстов произведений и переводов  И. И. Пыстина  (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций; выравнивание абзацев, исправление орфографии старых изданий на современную орфографию) и размещение данных текстов в онлайн библиотеке "Коми гижӧд".
6.2. Размещение текстов номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-10-18, 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16, 1924-12-18, 1924-12-20, 1924-12-23, 1924-12-26, 1924-12-27 и 1924-12-30 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".
6.3. Перевод на современную графику текстов книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и  "Войвыв край овмӧс йылысь очеркъяс" (1932), а также альманахов "Комі каԉенԁар" за 1922, 1924 и 1924 гг.; их повторная вычитка и размещение в онлайн библиотеке "Коми гижӧд" параллельно с текстами на оригинальной графике.
6.4. Повторная вычитка на современной графике текстов книжных изданий "Вотјас" (1923), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Важ јӧзлӧн історіја" (1932),  "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и  их размещение в онлайн библиотеке "Коми гижӧд" параллельно на современной и оригинальной графике.
6.5. Добавление текстов изданий 1932 года на  молодцовице "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" в онлайн библиотеку "Коми гижӧд" параллельно к ранее размещенным редакциям на современной графике.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "М. Н. Скаткин. Природоведение : 4-ӧд класслы учебник" (1962, "Тӧвся Дуда (Е. Афанасьевалӧн 2022' вося небӧг)", "Челядьдырӧй, сё майбырӧй! (Э. И. Поляковалӧн 2022' вося небӧг)", "Аська, Петрушка, Тришка да мукӧд (2022' вося небӧг)", "Войвывса календар. Северный календарь (А. Сукгоевалӧн 2022' вося небӧг)", "Кӧні быдмӧ маръямоль. Где растёт маръямоль (А. Сукгоевалӧн 2022' вося небӧг)", "Ӧтисянь дасӧдз (2000ʼ вося небӧг)", "География (гырысьяслы, 1936’ вося небӧг)"‎‎, "Газетнӧй лист: электрическӧй опытъяс (1933ʼ вося небӧг)", "География (4-ӧд класслы, 1939ʼ вося небӧг)", "1922 – сюрс ӧкмыссё кызь кыкӧд во (1922ʼ вося небӧг)", "Коми календар. 1923" и "Коми календар. 1924".
7.2. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-10-18, 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16, 1924-12-18, 1924-12-20, 1924-12-23, 1924-12-26, 1924-12-27 и 1924-12-30.
7.3. Внесение отметок о корректурах в текстах изданий 1932 года "Фіԅіка. 2-ӧд юкӧн", "Војвыв крај овмӧс јылыԍ очеркјас", "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ",  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын", "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум", "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм", а также изданий "Важ јӧзлӧн історіја" (1932), "Шӧвк тупыль" (2012), "А. Ԋечајев. Географія : І ст. школаса ІІІ-ӧԁ волы" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и "Вотјас" (1923) на соотвествующие страницы wiki-ресурса "Коми тӧданін".
7.4. Пополнение библиографии коми периодики на сайте "Коми тӧданін" содержанием номеров газеты «Коми му» (2021. №52, 2022. №№1-26) и журнала «Йӧлӧга» (2021. №12, 2022. №№1-6).
7.5. Создание и заполнение отдельных wiki-страниц по произведениям И. И. Пыстина, имеющих разные редакции и добавления ссылок на  тексты произведений, размещенные в онлайн библиотеке "Коми гижӧд", с wiki-страницы автора на сайте "Коми тӧданін".
7.6. Создание ссылок со страниц изданий на страницы авторов и наоборот.
7.7. Пополнение погодовых списков книжных изданий, создание ссылок на новые страницы.
 
 8. Развитие образовательного портала "Коми мутӧдӧм":
 
8.1. Создание модернизированных версий текстов по географии из изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и  "Fiⱬiçeskəj geografija" (1933)  и размещение обновленных текстов на портале "Коми мутӧдӧм".
8.2. Выравнивание в программе WinMerge и сравнение в программе Meld конгруэнтных коми текстов разных изданий учебников по естествознанию для 3-4 классов (1935 и 1940) и географии для 3 класса (1936 и 1939).

9. Пополнение лексической базы FU-Lab:

9.1. Работа по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13. Участие в мероприятиях:
 
13.1. Участие в подписании соглашения о взаимодействии с Национальной библиотекой РК.
13.2. Участие в мероприятии "Достояние Севера-2022"; в рамках подготовки к мероприятию составлена Google-презентация по продуктам лаборатории FU-Lab.

2022ʼ кӧч тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 16:19 15.09.2022

2022.08.29 – 2022.09.23
 
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Усть-Куломского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов; выравнивание текста оригинала с коми переводом в программе WinMerge по сайтам Усть-Куломского района.
2.2. Создание метаразметок для русскоязычных текстов журналов "Ведомости нормативных актов органов государственной власти Республики Коми" от 1996 (№№ 1-12), 1997 (№№ 1-12), 1998 (№№ 1-12) и 1999 (№№ 1-12) годов; разбивка коми и русских текстов на предложения и выравнивание русских оригиналов с коми переводом текстов за 1996-1998 гг.
2.3. Перевод текстов газеты "Коми му" (2022 №32) с коми языка на русский язык для корпуса параллельных текстов.
2.4. Сборка текстов новостной ленты "Официального портала Республики Коми" на коми и русском языках за июнь-сентябрь 2022 г., их  обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) и выравнивание разноязычных эквивалентов в программе WinMerge.
2.5. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии,  метаразметка) русскоязычных оригиналов изданий "В. А. Тетюрев. Естествознание. 3 класс" (1940),  "В. А. Тетюрев. Естествознание. 4 класс" (1940),  "М. Н. Скаткин. Природоведение. 4 класс"  (1968), "Л. Г. Терехова, В.Г . Эрдели. География. 3 класс" (1938), "Л. Г. Терехова, В. Г. Эрдели. География. 4 класс" (1938), "И. Г. Иванов. География частей света и важнейших стран (без СССР)" (1935), "П. Н. Счастнев, П. Г. Терехов. География частей света: учебник для 6 класса" (1959). Выравнивание коми переводов с русскими оригиналами в программе WinMerge.
2.6. Обработка в программе LibreOffice Writer  (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) коми и русских текстов двуязычного издания "Шӧвк тупыль" (2012)  и выравнивание в программе WinMerge коми оригинала с русским переводом.   
2.7. Выравнивание коми перевода текста переводных изданий "А. Авдеенко. Гӧраясын тулыс" (1959) и  "На пороге юности" (1959)  с русским оригиналом в программе WinMerge.
2.8. Включение выравненных пар текстов (ru-kv), указанных в пп. 2.4, 2.5, 2.6 и 2.7 в корпус параллельных текстов.
2.7. Поиск и сбор для параллельного корпуса дополнительных оригиналов крупных художественных произведений, имеющих перевод на коми язык.
2.10. Дополнение списка исключений и добавление условий в программу разбивки параллельных текстов на предложения.
2.11. Разработка опции тематической разбивки в корпусе параллельных текстов.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) текста издания "М. Н. Скаткин. Природоведение. 4-ӧд класслы учебник" (1962).
3.2. Извлечение из pdf файла текстов свежих номеров газеты "Коми му"  (2022. №35-38), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
3.3. Включение  в корпус коми языка коми текстов изданий "М. Н. Скаткин. Природоведение. 4-ӧд класслы учебник" (1962), "Шӧвк тупыль" (2012), "А. Авдеенко. Гӧраясын тулыс" (1959), свежих номеров газеты "Коми му" (2022. №35-38), а также коми текстов официального портала РК за июнь-сентябрь 2022 г.
3.4. Замена в корпусе коми языка текстов произведений и переводов И. И. Пыстина откорректированными вариантами.

4. Текстовое пополнение молодцовского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader  текстов на молодцовице изданий "Поԉарнӧј похоԁ Краԍінӧн" (1930) и "Комі облаԍтлы ԁасвіт во" (1936).  
4.2. Перевод на современную графику, вычитка и корректирование текста издания "Важ јӧзлӧн історіја" (1932), оригинал добавлен в молодцовский корпус коми языка.
4.3. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-12-20, 1924-12-23, 1924-12-26, 1924-12-27 и 1924-12-30; их обработка в программе LibreOffice Writer и их включение в молодцовский корпус.
4.4. Включение в молодцовский корпус текстов изданий "В. А. Ԏеԏурев. Јесԏествознаԋіје. Первојја чаԍт" (1935),  "В. А. Ԏеԏурев. Јесԏествознаԋіје. Мӧԁ чаԍт (1935)", "Л. Г. Ԏерехова ԁа В. Г. Ерԁеԉі.  Географіја. Первојја чаԍԏ. Начаԉнӧј школаса којмӧԁ класслы учебԋік (1936)", "Г. І. Іванов. Географіја свет јукӧнјаслӧн ԁа меԁтӧԁчана странајаслӧн (СССР-тӧг)" (1936).

5. Работа над пополнением коми-пермяцкого корпуса:

5.1. Пополнение коми-пермяцкого корпуса интернет-контентом за август-сентябрь 2022 г

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение текстов комиязчных номеров газеты "Југыԁ туј" за 1924-12-20, 1924-12-23, 1924-12-26, 1924-12-27 и 1924-12-30 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".
6.2. Размещение в онлайн библиотеке "Коми гижӧд" текста издания "Важ јӧзлӧн історіја" (1932) на современной графике и молодцовском оригинале.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Создание и заполнение wiki-страницы по изданию М. Н. Скаткин. Природоведение : 4-ӧд класслы учебник" (1962).
7.2. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за 1924-12-20, 1924-12-23, 1924-12-26, 1924-12-27 и 1924-12-30.
7.3. На wiki-странице изданий "Важ јӧзлӧн історіја" (1932), "Шӧвк тупыль" (2012) и "А. Ԋечајев. Географія : І ст. школаса ІІІ-ӧԁ волы" (1932) сделаны отметки о корректуре текста.

8. Работа по образовательному порталу "Коми мутӧдӧм":

8.1. Выравнивание в программе WinMerge и сравнение в программе Meld конгруэнтных коми текстов разных изданий учебников по естествознанию для 3-4 классов (1935 и 1940) и географии для 3 класса (1936 и 1939).

9. Пополнение лексической базы FU-Lab:

9.1. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

13.  Участие в мероприятиях:

13.1. Участие в мероприятии "Достояние Севера-2022"; в рамках подготовки к мероприятию составлена Google-презентация по продуктам лаборатории FU-Lab.

FU-Lab 2022.09.19-2022.09.23

опубликовал Öньö Лав в 16:17 15.09.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.09.19-2022.09.23.

  1.  
  2. Разбивка текстов журналов "Ведомости нормативных актов органов государственной власти Республики Коми" от 1996 (№№ 1-12), 1997 (№№ 1-12), 1998 (№№ 1-12) и 1999 годов (№№ 1-12) на отдельные предложения для последующего создания параллельных текстов на коми и русском языках.
  3. Выравнивание параллельных текстов журнала "Ведомости нормативных актов органов государственной власти Республики Коми" от 1996-1997 и 1998 (№№ 1-6)  на коми и русском языках в программе  WinMerge.
  4. Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №37) и их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  5. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  6. Перевод текстов газеты "Коми му" (2022№32) с коми языка на русский язык для корпуса параллельных текстов.
  7. Распространение комиязычного контента в соц. сетях.
  8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.09.12-2022.09.16

опубликовал Öньö Лав в 14:26 15.09.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.09.12-2022.09.16.

  1.  
  2. Создание метаразметок для русскоязычных текстов журналов "Ведомости нормативных актов органов государственной власти Республики Коми" от 1996 (№№ 1-12), 1997 (№№ 1-12), 1998 (№№ 1-12) и 1999 (№№ 1-12) годов.
  3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (проверка орфографии, метаразметка) русскоязычных оригиналов учебников "Л.Г. Терехова, В.Г. Эрдели. География. 3 класс" (1938),  "Л.Г. Терехова, В.Г. Эрдели. География. 4 класс" (1938), "И. Г. Иванов. География частей света и важнейших стран (без СССР)" (1935). Выравнивание русского оригинала с коми переводом в программе WinMerge.
  4. Сбор для параллельного корпуса дополнительных оригиналов крупных художественных произведений, имеющих перевод на коми язык.
  5. Выравнивание коми и русского текстовых эквивалентов художественного произведения "На пороге юности" (1959) в программе WinMerge.
  6. Обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) и выравнивание в программе WinMerge  текстов новостной ленты официального портала РК за июнь-сентябрь 2022 г.
  7. Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №37) и их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
  8. Включение новых обработанных коми текстов в корпус коми языка и новых выравненных пар текстов (ru-kv) в базу параллельного корпуса.
  9. Выравнивание в программе WinMerge и сравнение в программе Meld конгруэнтных коми текстов разных изданий учебников "В. А. Тетюрев. Естествознание. 3 класс" (1935 и 1940),  "В. А. Тетюрев. Естествознание. 4 класс" (1935 и 1940),  "Л.Г. Терехова, В.Г. Эрдели. География. 3 класс" (1936 и 1939).
  10. Продолжение работы по составлению словарной статьи "Гыж" для интегрального словаря коми языка.
  11. Продолжение перевода текстов газеты "Коми му" с коми языка на русский язык для корпуса параллельных текстов.
  12. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.09.05-2022.09.09

опубликовал Öньö Лав в 23:16 08.09.2022

 В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.09.05-2022.09.09

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Усть-Куломского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии,  метаразметка) русскоязычных оригиналов учебников "М. Н. Скаткин. Природоведение. 4 класс"  (1968), "В. А. Тетюрев. Естествознание. 3 класс" (1940),  "В. А. Тетюрев. Естествознание. 4 класс" (1940), "П.Н. Счастнев, П. Г. Терехов. География частей света: учебник для 6 класса" (1959). Выравнивание коми переводов с русскими оригиналами в программе WinMerge.
  4. Выравнивание в программе WinMerge коми оригинала с русским переводом текстов двуязычного издания  "Шӧвк тупыль" (2012).
  5. Добавление в корпус коми языка текста переводного издания "А. Авдеенко. Гӧраясын тулыс" (1959). Выравнивание коми перевода данного произведения с русским оригиналом в программе WinMerge.
  6. Дополнение списка исключений и добавление условий в программу разбивки параллельных текстов на предложения.
  7. Разработка опции тематической разбивки в корпусе параллельных текстов.
  8. Включение новых выравненных пар текстов в базу параллельного корпуса.
  9. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-12-27 и 1924-12-30, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  10. Перевод на современную графику, вычитка и корректирование текста издания "Важ јӧзлӧн історіја" (1932). Отметки об исправлениях сделаны на информационном wiki-ресурсе "Коми тӧданін". Тексты параллельно на современной графике и молодцовице добавлены в онлайн библиотеку "Коми гижӧд", а оригинальный текст — в молодцовский корпус.
  11. Иззвлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №36), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  12. Продолжение работы по составлению словарной статьи "ГЫЖ" для интегрального словаря коми языка.
  13. Перевод текстов газеты "Коми му" с коми языка на русский язык для корпуса параллельных текстов.
  14. Сборка текстов новостной ленты официального портала РК.
  15. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  16. Распространение комиязычного контента в соц. сетях.
  17. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности
FU-Lab 2022.08.29-2022.09.02

опубликовал Öньö Лав в 23:26 01.09.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.29-2022.09.02

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Усть-Куломского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов; выравнивание текста оригинала с коми переводом в программе WinMerge по сайтам Усть-Куломского района.
  3. Обработка в программе LibreOffice Writer  (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) коми и русских текстов двуязычного издания "Шӧвк тупыль" (2012) для корпуса коми языка и корпуса параллельных текстов; подготовка текстов к выравниванию по предложениям.
  4. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer (проверка орфографии, выявление новой коми лексики, метаразметка, расстановка языковых тэгов) текста издания "М. Н. Скаткин. Природоведение : 4-ӧд класслы учебник" (1962). Текст добавлен в корпус коми языка,  на информационном wiki-ресурсе "Коми тӧданін" создана и заполнена страница по данному изданию.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-12-20, 1924-12-23 и 1924-12-26, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6. Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №35), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Замена в корпусе коми языка текстов произведений и переводов И. И. Пыстина откорректированными вариантами.
  8. Участие в мероприятии "Достояние Севера-2022"; в рамках подготовки к мероприятию составлена Google-презентация по продуктам лаборатории FU-Lab.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.08.22-2022.08.26

опубликовал Öньö Лав в 23:59 25.08.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.22-2022.08.26
     

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайта администрации Усть-Куломского района Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Перевод текстов газеты "Коми му" с коми языка на русский язык для корпуса параллельных текстов.
  4. Обработка (вычитка текста, модернизация орфографии) и размещение в онлайн библиотеке "Коми гижӧд" переведенного И. И. Пыстиным романа "Том гвардия".
  5. Перевод на современную графику, вычитка и корректирование текста издания "Роч му історіја җеԋыԃік очеркын" (1932). Отметки об исправлениях сделаны на информационном wiki-ресурсе "Коми тӧданін". Тексты параллельно на современной графике и молодцовице добавлены в онлайн библиотеку "Коми гижӧд", а оригинальный текст — в молодцовский корпус.
  6. Распознавание и вычитка в программе ABBYY FineReader,  обработка в программе LibreOffice Writer, перевод на современную графику и корректирование в соотвествии с современной орфографией текста издания "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934). Оригинальный текст добавлен в латинский корпус коми языка, отметки об исправлениях сделаны на информационном wiki-ресурсе "Коми тӧданін".
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-12-16 и 1924-12-18, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №34), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Работа по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка (выявление элементарных словосочетаний).
  10. Пополнение коми-пермяцкого корпуса интернет-контентом за август 2022 г.
  11. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  12.  Распространение комиязычного контента в соц. сетях.
  13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ моз тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 11:24 24.08.2022

2022.07.25 – 2022.08.26
 
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и государственных учреждений Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Начало выравнивания коми перевода текстов официальных сайтов Сысольского района с текстами на языке оригинала в программе WinMerge.
2.3. Распознавание и вычитка в программе ABBYY FineReader  текстов издания "Шӧвк тупыль" (2012) на коми и русском языках.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Извлечения из pdf файлов текстов свежих номеров газеты "Коми му"  (2022. №30-34); обработка указанных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.
3.2. Сканирование, обработка сканов в программе ABBYY FineReader и создание pdf-копии комиязычного издания "М.Н. Скаткин. Природоведение. 4 кл." (1962).

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Распознавание и вычитка в программе ABBYY FineReader  текстов на коми латинице из изданий "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и на молодцовице из издания "Вотјас" (1923); корректирование текстов с помощью латинского/молодцовского спеллера в программе LibreOffice Writer.  
4.2. Перевод на современную графику, вычитка и корректирование в программе LibreOffice Writer текстов изданий 1932 года: "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ",  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын".  
4.3. Корректирование в программе LibreOffice Writer оригинальных текстов изданий 1932 года "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм".
4.4.  Загрузка в молодцовский (либо латинский) корпус текстов книжных изданий "Вотјас" (1923), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932)‎‎, "Кӧрым ԍілосујтӧмын отсӧг" (1932)‎‎, "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932)‎‎, "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932)‎‎, "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934), а также текстов комиязчных номеров газеты "Југыԁ туј" за 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16 и 1924-12-18.

5. Работа над пополнением коми-пермяцкого корпуса:

5.1. Пополнение коми-пермяцкого корпуса интернет-контентом за июль-август 2022 г.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение текстов комиязчных номеров газеты "Југыԁ туј" за 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16 и 1924-12-18 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".
6.2. Повторная вычитка на современной графике текстов книжных изданий "Вотјас" (1923), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932),  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и  их размещение в онлайн библиотеке "Коми гижӧд" параллельно на современной и оригинальной графике.
6.3. Добавление текстов изданий 1932 года на  молодцовице "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" в онлайн библиотеку "Коми гижӧд" параллельно к ранее размещенным редакциям на современной графике.
6.4. Обработка текстов произведений и переводов  И. И. Пыстина  (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций; выравнивание абзацев, исправление орфографии старых изданий на современную орфографию) и размещение данных текстов в онлайн библиотеке "Коми гижӧд".

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Внесение отметок о корректурах в текстах изданий 1932 года "Фіԅіка. 2-ӧд юкӧн", "Војвыв крај овмӧс јылыԍ очеркјас", "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ",  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын", "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум", "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм", а также изданий "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и "Вотјас" (1923) на соотествующие страницы wiki-ресурса "Коми тӧданін".
7.2. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16 и 1924-12-18.
7.3. Создание и заполнение отдельных wiki-страниц по произведениям И. И. Пыстина, имеющих разные редакции и добавления ссылок на  тексты произведений, размещенные в онлайн библиотеке "Коми гижӧд", с wiki-страницы автора на сайте "Коми тӧданін".
 
8. Пополнение образовательного портала "Коми мутӧдӧм":
 
8.1. Создание модернизированной версии текстов по географии из издания "Fiⱬiçeskəj geografija" (1933) и размещение обновленных текстов на портале "Коми мутӧдӧм".

9. Пополнение лексической базы FU-Lab:

9.1. Начало работы по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 2022.08.15-2022.08.19

опубликовал Öньö Лав в 17:23 18.08.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.15-2022.08.19

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администрации и учреждений  Сысольского района Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Выравнивание текста оригинала с коми переводом в программе WinMerge по сайтам Сысольского района (3 часть).
  4. Распознавание и вычитка в программе ABBYY FineReader  текстов издания "Шӧвк тупыль" (2012) на коми и русском языках.
  5. Подготовка (вычитка текста, исправление орфографии на современную) и размещение в онлайн библиотеке "Коми гижӧд" переводного романа "Том гвардия" (переводчик И. И. Пыстин). Добавление ссылки на размещенное в библиотеке произведение с wiki-страницы автора коми текста на сайте "Коми тӧданін".
  6. Распознавание и вычитка в программе ABBYY FineReader  текстов на коми латинице из издания "Fiⱬiçeskəj geografija" (1933) и на молодцовице из издания "Вотјас" (1923); корректирование текстов с помощью латинского/молодцовского спеллера в программе LibreOffice Writer,  конвертация на современную графику и сравнение с раннее набранным текстом в программе Meld, поиск и исправление оставшихся опечаток, ошибок распознавания и набора. Информация об опечатках внесена на соответствующие wiki-страницы издания сайта "Коми тӧданін". Оригинальный текст добавлен в латинский/молодцовский раздел корпуса коми языка, текст на современной графике - в онлайн библиотеку "Коми гижӧд".
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-12-06, 1924-12-09 и 1924-12-11, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8. Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №33), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9. Продолжение работы по составлению словарной статьи "ГЫЖ" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11.  Распространение комиязычного контента в соц. сетях.
FU-Lab 2022.08.08-2022.08.12

опубликовал Öньö Лав в 23:26 11.08.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.08-2022.08.12

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и учреждений  Сысольского района Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Подготовка  (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций, выравнивание абзацов, исправление орфографии старых изданий на современную орфографию) и размещение в онлайн библиотеке "Коми гижӧд" произведений И. И. Пыстина, опубликованных в юбилейном издании "Бӧрйӧм гижӧдъяс" (2009), а так же переводных произведений 1947, 1948, 1951 годов. Добавление ссылок на данные произведения с wiki-страницы автора на сайте "Коми тӧданін".  Создание и заполнение отдельных страниц по каждому произведению на том же ресурсе.
  4. Перевод на современную графику, вычитка и корректирование текстов изданий 1932 года:  "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ". Отметки об исправлениях сделаны на информационном wiki-ресурсе "Коми тӧданін". Тексты на современной графике и молодцовице добавлены в онлайн библиотеку "Коми гижӧд", а оригинальный текст — в молодцовский корпус.
  5. Добавление текстов изданий 1932 года на  молодцовице "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" в онлайн библиотеку "Коми гижӧд" (параллельно к ранее размещенным редакциям на современной графике), а также включение оригинальных текстов в молодцовский корпус. Отметки об исправлениях сделаны на информационном wiki-ресурсе "Коми тӧданін".
  6. Внесение отметок о корректурах в текстах изданий 1932 года "Фіԅіка. 2-ӧд юкӧн", "Војвыв крај овмӧс јылыԍ очеркјас" на соотествующие страницы вики-ресурса "Коми тӧданін".
  7. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-12-02 и 1924-12-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  8.  Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №32), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  9.  Начало работы по составлению словарной статьи "ГЫЖ" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.
  10. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  11. Распространение комиязычного контента в соц. сетях.
  12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.08.01-2022.08.05

опубликовал Öньö Лав в 0:15 05.08.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.01-2022.08.05

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и учреждений Усть-Куломского и Сысольского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Подготовка  (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций, выравнивание абзацов) и размещение в онлайн библиотеке "Коми гижӧд" произведений И. И. Пыстина, опубликованных в юбилейном издании "Бӧрйӧм гижӧдъяс" (2009).   Добавление ссылок на данные произведения с wiki-страницы автора на сайте "Коми тӧданін".  Создание и заполнение отдельных страниц по каждому произведению на том же ресурсе.
  4. Перевод на современную графику, вычитка и корректирование текстов изданий 1932 года: "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм" и "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ". Отметки об исправлениях сделаны на информационном wiki-ресурсе "Коми тӧданін". Тексты на современной графике и молодцовице добавлены в онлайн библиотеку "Коми гижӧд", а оригинальный текст — в молодцовский корпус.
  5. Корректирование оригинального текста издания  "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын  саԋітарнӧј міԋімум" (1932)‎‎, информация об изменениях внесена на сайт "Коми тӧданін", текст добавлен в молодцовский корпус.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-11-20, 1924-11-25 и 1924-11-28, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страниц с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  7.  Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №31), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Размещение в группе FU-Lab социальной сети ВКонтакте информации о размещении в онлайн-библиотеке "Коми гижӧд" электронных версий коми календарей 1920 годов и произведений автора Алёна Шомысова.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.07.25-2022.07.29

опубликовал Öньö Лав в 10:17 29.07.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.25-2022.07.29

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и учреждений Усть-Куломского, Сысольского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Начало выравнивания коми перевода текстов официальных сайтов Сысольского района с текстами на языке оригинала в программе WinMerge.
  4. Завершение повторной вычитки и размещения в коми онлайн библиотеке параллельно с оригинальными текстами на молодцовском шрифте текстов альманаха "Комі каԉенԁар" за  1924 гг., создание ссылок на размещенные в онлайн-библиотеке тексты со wiki-страницы издания на сайте "Коми тӧданін".
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-10-25 и 1924-11-01, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данным номерам в онлайн-справочнике "Коми тӧданін".
  6.  Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №30), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  7. Сканирование, обработка сканов в программе ABBYY FineReader и создание pdf-копии комиязычного издания "М.Н. Скаткин. Природоведение. 4 кл." (1962).
  8. Пополнение коми-пермяцкого корпуса интернет-контентом за июль 2022 г.
  9. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  10. Распространение комиязычного контента в соц. сетях.
  11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
2022ʼ сора тӧлысся отчётӧ FU-Lab-лӧн пай

опубликовал Öньö Лав в 16:40 24.07.2022

2022.06.27 – 2022.07.22
 
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:

2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и государственных учреждений Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.

2.2. Сборка текстов новостной ленты официального портала РК на коми и русском языках за март-июнь 2022 года, обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов), выравнивание оригинала с переводом в программе WinMerge и загрузка коми версии в корпус коми языка.

2.3. Разработка структуры корпуса параллельных текстов на русском и коми языках и создание первой версии параллельного корпуса.

2.4. Продолжение работы над локализацией приложений операционной системы Simply Linux и перевода на коми язык глоссария данной ОС, предоставленного разработчиком.

3. Текстовое пополнение и оптимизация Корпуса коми языка:

3.1. Систематизация pdf файлов с номерами газеты "Выль туйӧд" за 2011, 2013-2017 гг., полученных от редакции газеты.

3.2. Извлечения из pdf файлов текстов свежих номеров газеты "Коми му"  (2022. №26-29) и  журнала "Йӧлӧга" (2022 №6), а также текстов двух номеров газеты "Выль туйӧд" за 2011 год (2011-01-05, 2011-01-14); обработка указанных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).

3.3 Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов номеров газет "Водзӧ" за январь 1946 года и  "Выль Войвыв" за март-декабрь 1956 года.

3.4. Включение всех обработанных текстов в корпус коми языка, еженедельное обновление корпуса.

4. Текстовое пополнение молодцовского и латинского корпуса:

4.1. Сканирование и обработка в программе ABBYY FineReader сканов, создание pdf копий книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).

4.2. Сканирование ксерокопий дополнительных комиязычных номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, сделанных в Национальной библиотеке Республики Коми.

4.3. Создание фотокопий альманахов "Комі каԉенԁар" за 1923 и 1924 гг. в Национальном архиве Республики Коми.

4.4. Корректура оригинальных текстов изданий "1922. Комі јӧзлы каԉенԁар" (1921) и "Войвыв край овмӧс йылысь очеркъяс" (1932).

4.5. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов альманахов "Комі каԉенԁар" за 1923 и 1924 гг., книжных изданий  "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).

4.6.  Загрузка в молодцовский (либо латинский) корпус текстов альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг., книжных изданий  "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и  "Войвыв край овмӧс йылысь очеркъяс" (1932), а также текстов номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-09-23 и 1924-10-18.

5. Работа над пополнением коми-пермяцкого корпуса:

5.1. Извлечение из pdf файлов текстов коми-пермяцкого журнала "Лов шы" (2020-21) их обработка в программе LibreOffice (выравнивание абзацев, метаразметка, расстановка языковых тэгов) и загрузка в коми-пермяцкий корпус.

6. Пополнение онлайн библиотеки "Коми гижӧд":

6.1. Размещение текстов номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-09-23 и 1924-10-18 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".

6.2. Перевод на современную графику текстов книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и  "Войвыв край овмӧс йылысь очеркъяс" (1932), а также альманахов "Комі каԉенԁар" за 1922, 1924 и 1924 гг.; их повторная вычитка и размещение в онлайн библиотеке "Коми гижӧд" параллельно с текстами на оригинальной графике.

7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":

7.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Тӧвся Дуда (Е. Афанасьевалӧн 2022' вося небӧг)", "Челядьдырӧй, сё майбырӧй! (Э. И. Поляковалӧн 2022' вося небӧг)", "Аська, Петрушка, Тришка да мукӧд (2022' вося небӧг)", "Войвывса календар. Северный календарь (А. Сукгоевалӧн 2022' вося небӧг)", "Кӧні быдмӧ маръямоль. Где растёт маръямоль (А. Сукгоевалӧн 2022' вося небӧг)", "Ӧтисянь дасӧдз (2000ʼ вося небӧг)", "География (гырысьяслы, 1936’ вося небӧг)"‎‎, "Газетнӧй лист: электрическӧй опытъяс (1933ʼ вося небӧг)", "География (4-ӧд класслы, 1939ʼ вося небӧг)", "1922 – сюрс ӧкмыссё кызь кыкӧд во (1922ʼ вося небӧг)", "Коми календар. 1923" и "Коми календар. 1924".

7.2. Создание ссылок со страниц изданий на страницы авторов и наоборот.

7.3. Пополнение погодовых списков книжных изданий, создание ссылок на новые страницы.

7.4. Пополнение библиографии коми периодики на сайте "Коми тӧданін" содержанием номеров газеты «Коми му» (2021. №52, 2022. №№1-26) и журнала «Йӧлӧга» (2021. №12, 2022. №№1-6).

7.5. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11 и 1924-10-18
 
8. Пополнение образовательного портала "Коми мутӧдӧм":
 
8.1. Создание модернизированной версии текстов по географии из издания "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и размещение обновленных текстов на портале "Коми мутӧдӧм".

9. Участие в мероприятиях:
 
9.1. Участие в подписании соглашения о взаимодействии с Национальной библиотекой РК.

10. Пополнение словарной базы средства проверки правописания Hunspell:

10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.

10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.

11. Распространение комиязычного контента в соц. сетях.

12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.

FU-Lab 2022.07.18-2022.07.22

опубликовал Öньö Лав в 9:51 22.07.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.18-2022.07.22

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и учреждений Сысольского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Создание электронных копий альманахов "Комі каԉенԁар" за 1923 и 1924 гг. из фондов Национального архива Республики Коми; их распознавание  и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов), включение в молодцовский корпус коми языка; перевод текстов на современную графику, их повторная вычитка и размещение в коми онлайн библиотеке параллельно с оригинальными текстами на молодцовском шрифте; создание и заполнение wiki-страниц, посвященных данным изданиям, в онлайн-справочнике "Коми тӧданін".
  4. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-10-18, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по данному номеру в онлайн-справочнике "Коми тӧданін".
  5.  Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №29), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  6.  Создание модернизированной версии текстов по географии из издания "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), размещение данных текстов на портале "Коми мутӧдӧм".
  7. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  8. Распространение комиязычного контента в соц. сетях.
  9. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.07.11-2022.07.15

опубликовал Öньö Лав в 0:13 15.07.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.11-2022.07.15

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и учреждений Сысольского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Распознавание и вычитка в программе ABBYY FineReader текстов книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов), включение соответственно в молодцовский и латинский корпуса коми языка; перевод текстов на современную графику, их повторная вычитка и размещение в коми онлайн библиотеке параллельно с оригинальными текстами на молодцовском шрифте и коми латинице; создание и заполнение wiki-страниц, посвященных данным изданиям, в онлайн-справочнике "Коми тӧданін".
  4. Распознавание  и вычитка в программе ABBYY FineReader текстов газеты "Выль Войвыв" за октябрь-декабрь 1956 года; обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  5.  Извлечение из pdf файла текстов свежего номера газеты "Коми му"  (2022. №28), их обработка в программе LibreOffice Writer (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  6. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов газеты "Југыԁ туј" за 1924-09-11  и 1924-09-23, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение wiki-страницы с оглавлением по номеру за 1924-09-11 в онлайн-справочнике "Коми тӧданін".
  7. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  8. Распространение комиязычного контента в соц. сетях.
  9. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.07.04-2022.07.08

опубликовал Öньö Лав в 20:18 07.07.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.04-2022.07.08

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и учреждений Сысольского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Сканирование и обработка сканов в программе ABBYY FineReader книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).
  4. Распознавание  и вычитка в программе ABBYY FineReader текстов газеты "Выль Войвыв" за март-сентябрь 1956 года; обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  5. Распознавание и вычитка в программе ABBYY FineReader молодцовских текстов комиязычных номеров газеты "Југыԁ туј" за 1924-08-27 и 1924-09-04, их обработка в программе LibreOffice Writer и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд", а в оригинале в молодцовский корпус; создание и заполнение страниц с оглавлением по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  6. Извлечение из pdf файлов текстов коми-пермяцкого журнала "Лов шы" (2020-21) их обработка в программе LibreOffice (выравнивание абзацев, метаразметка, расстановка языковых тэгов) и загрузка в коми-пермяцкий корпус.
  7. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022 №27) и журнала "Йӧлӧга" (2022 №6), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  8. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельной страницы по книжному изданию на коми языке: "Ӧтисянь дасӧдз (2000ʼ вося небӧг)". Создание ссылок на станицу издания со страниц авторов произведений.
  9. Пополнение на справочном wiki-ресурсе "Коми тӧданін" библиографии периодики содержанием номеров журнала «Йӧлӧга» (2021. №12, 2022. №№1-6);
  10. Создание первой версии параллельного корпуса переводов.
  11. Участие в подписании соглашения о взаимодействии с Национальной библиотекой РК.
  12. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  13. Распространение комиязычного контента в соц. сетях.
  14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
FU-Lab 2022.06.27-2022.07.01

опубликовал Öньö Лав в 18:19 30.06.2022

В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.27-2022.07.01

 

  1.  
  2. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского и Ижемского районов Республики Коми для коми локализации и корпуса параллельных текстов.
  3. Систематизация pdf файлов с номерами газеты "Выль туйӧд" за 2011, 2013-2017 гг., полученных от редакции газеты.
  4. Извлечения из pdf файлов текстов двух номеров газеты "Выль туйӧд" за 2011 год (2011-01-05, 2011-01-14) и свежего номера газеты  "Коми му" (2022 №26), обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
  5. Сборка текстов новостной ленты официального портала РК на коми и русском языках за март-июнь 2022 года, обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов), выравнивание оригинала с переводом в программе WinMerge и загрузка коми версии в корпус коми языка.
  6. Распознавание и вычитка в программе  ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка текстов номеров газеты "Водзӧ" за январь 1946 года.
  7. Конвертация на современную графику и обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов изданий  "1922. Комі јӧзлы каԉенԁар" (1922) и "Войвыв край овмӧс йылысь очеркъяс" (1932); тексты размещены на обеих графических системах в онлайн библиотеке "Коми гижӧд" и добавлены в молодцовский корпус.
  8. Сканирование ксерокопий дополнительных комиязычных номеров газеты "Југыԁ туј" за 1924 г., сделанных в Национальной библиотеке Республики Коми; распознавание и вычитка в программе ABBYY FineReader молодцовских текстов номеров за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, их обработка в программе LibreOffice Writer, загрузка в молодцовский корпус и размещение в переводе на современную графику в онлайн библиотеке "Коми гижӧд"; создание и заполнение страниц с оглавлением и гиперссылками по данным номерам в справочном wiki-ресурсе "Коми тӧданін".
  9. Пополнение библиографии периодики на сайте "Коми тӧданін" содержанием номеров газеты «Коми му» за минувшие полгода (2021. №52, 2022. №№1-26).
  10. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Тӧвся Дуда (Е. Афанасьевалӧн 2022' вося небӧг)", "Челядьдырӧй, сё майбырӧй! (Э. И. Поляковалӧн 2022' вося небӧг)", "Аська, Петрушка, Тришка да мукӧд (2022' вося небӧг)", "Войвывса календар. Северный календарь (А. Сукгоевалӧн 2022' вося небӧг)", "Кӧні быдмӧ маръямоль. Где растёт маръямоль (А. Сукгоевалӧн 2022' вося небӧг)" и пополнение таблицы "2022" в разделе "Коми (зыряналӧн) небӧг 1939–2022", с созданием ссылок на новые страницы.
  11. Разработка структуры корпуса параллельных текстов на русском и коми языках.
  12. Продолжение работы над локализацией приложений операционной системы Simply Linux и перевода на коми язык глоссария данной ОС, предоставленного разработчиком.
  13. Пополнение словарной базы спелл-чеккера hunspell новой коми лексикой, выявленной в обрабатываемых текстах.
  14. Распространение комиязычного контента в соц. сетях.
  15. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
Яндекс.Метрика