опубликовал Öньö Лав в 23:16 08.09.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.09.05-2022.09.09
опубликовал Öньö Лав в 23:26 01.09.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.29-2022.09.02
опубликовал Öньö Лав в 23:59 25.08.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.22-2022.08.26
опубликовал Öньö Лав в 11:24 24.08.2022
2022.07.25 – 2022.08.26
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:
2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и государственных учреждений Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Начало выравнивания коми перевода текстов официальных сайтов Сысольского района с текстами на языке оригинала в программе WinMerge.
2.3. Распознавание и вычитка в программе ABBYY FineReader текстов издания "Шӧвк тупыль" (2012) на коми и русском языках.
3. Текстовое пополнение и оптимизация Корпуса коми языка:
3.1. Извлечения из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №30-34); обработка указанных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и их загрузка в корпус коми языка.
3.2. Сканирование, обработка сканов в программе ABBYY FineReader и создание pdf-копии комиязычного издания "М.Н. Скаткин. Природоведение. 4 кл." (1962).
4. Текстовое пополнение молодцовского и латинского корпуса:
4.1. Распознавание и вычитка в программе ABBYY FineReader текстов на коми латинице из изданий "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и на молодцовице из издания "Вотјас" (1923); корректирование текстов с помощью латинского/молодцовского спеллера в программе LibreOffice Writer.
4.2. Перевод на современную графику, вычитка и корректирование в программе LibreOffice Writer текстов изданий 1932 года: "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ", "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын".
4.3. Корректирование в программе LibreOffice Writer оригинальных текстов изданий 1932 года "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм".
4.4. Загрузка в молодцовский (либо латинский) корпус текстов книжных изданий "Вотјас" (1923), "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм" (1932), "Кӧрым ԍілосујтӧмын отсӧг" (1932), "Уҗалан вӧлӧс ԁӧԅӧрітӧм" (1932), "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын саԋітарнӧј міԋімум" (1932), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932), "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934), а также текстов комиязчных номеров газеты "Југыԁ туј" за 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16 и 1924-12-18.
5. Работа над пополнением коми-пермяцкого корпуса:
5.1. Пополнение коми-пермяцкого корпуса интернет-контентом за июль-август 2022 г.
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Размещение текстов комиязчных номеров газеты "Југыԁ туј" за 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16 и 1924-12-18 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".
6.2. Повторная вычитка на современной графике текстов книжных изданий "Вотјас" (1923), "Воjвылын граԁвыв пуктасjас вӧԃітӧм" (1932), "Муjас іԅвесткаалӧм" (1932), "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ" (1932), "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын" (1932), "Јонмӧԁам молочно-тӧварнӧј фермајас" (1932), "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ" (1932), "Роч му історіја җеԋыԃік очеркын" (1932), "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и их размещение в онлайн библиотеке "Коми гижӧд" параллельно на современной и оригинальной графике.
6.3. Добавление текстов изданий 1932 года на молодцовице "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм" в онлайн библиотеку "Коми гижӧд" параллельно к ранее размещенным редакциям на современной графике.
6.4. Обработка текстов произведений и переводов И. И. Пыстина (сравнение и корректирование в программе Meld текстов, имеющих разные редакции; вычитка текстов, не имеющих редакций; выравнивание абзацев, исправление орфографии старых изданий на современную орфографию) и размещение данных текстов в онлайн библиотеке "Коми гижӧд".
7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Внесение отметок о корректурах в текстах изданий 1932 года "Фіԅіка. 2-ӧд юкӧн", "Војвыв крај овмӧс јылыԍ очеркјас", "Воjвылын граԁвыв пуктасjас вӧԃітӧм", "Муjас іԅвесткаалӧм", "Кыԇі ԁа мыj вӧсна віԍӧ картупеԉ", "Зооԏехԋіческӧј меропріјаԏԏӧјас колхозјасын", "Јонмӧԁам молочно-тӧварнӧј фермајас", "Кыԇі бурмӧԁны скӧтлыԍ рӧԁ", "Роч му історіја җеԋыԃік очеркын", "Ԍезоннӧј робочӧјјас общежіԏԏӧјасын саԋітарнӧј міԋімум", "Турун заготовітӧм, прессујтӧм, краԋітӧм, нуӧм", "Кӧрым ԍілосујтӧмын отсӧг" и "Уҗалан вӧлӧс ԁӧԅӧрітӧм", а также изданий "Fiⱬiçeskəj geografija" (1933), "Medvoʒʒa şveḑeꞑꞑǝjas geometrijaьş" (1934) и "Вотјас" (1923) на соотествующие страницы wiki-ресурса "Коми тӧданін".
7.2. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за 1924-10-25, 1924-11-01, 1924-11-20, 1924-11-25, 1924-11-28, 1924-12-02, 1924-12-04, 1924-12-06, 1924-12-09, 1924-12-11, 1924-12-16 и 1924-12-18.
7.3. Создание и заполнение отдельных wiki-страниц по произведениям И. И. Пыстина, имеющих разные редакции и добавления ссылок на тексты произведений, размещенные в онлайн библиотеке "Коми гижӧд", с wiki-страницы автора на сайте "Коми тӧданін".
8. Пополнение образовательного портала "Коми мутӧдӧм":
8.1. Создание модернизированной версии текстов по географии из издания "Fiⱬiçeskəj geografija" (1933) и размещение обновленных текстов на портале "Коми мутӧдӧм".
9. Пополнение лексической базы FU-Lab:
9.1. Начало работы по составлению словарных статей "Гыж" и "Ма" для интегрального словаря коми языка на основе анализа контента корпуса коми языка.
10. Пополнение словарной базы средства проверки правописания Hunspell:
10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
11. Распространение комиязычного контента в соц. сетях.
12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 17:23 18.08.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.15-2022.08.19
опубликовал Öньö Лав в 23:26 11.08.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.08-2022.08.12
опубликовал Öньö Лав в 0:15 05.08.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.08.01-2022.08.05
опубликовал Öньö Лав в 10:17 29.07.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.25-2022.07.29
опубликовал Öньö Лав в 16:40 24.07.2022
2022.06.27 – 2022.07.22
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:
2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций и государственных учреждений Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Сборка текстов новостной ленты официального портала РК на коми и русском языках за март-июнь 2022 года, обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов), выравнивание оригинала с переводом в программе WinMerge и загрузка коми версии в корпус коми языка.
2.3. Разработка структуры корпуса параллельных текстов на русском и коми языках и создание первой версии параллельного корпуса.
2.4. Продолжение работы над локализацией приложений операционной системы Simply Linux и перевода на коми язык глоссария данной ОС, предоставленного разработчиком.
3. Текстовое пополнение и оптимизация Корпуса коми языка:
3.1. Систематизация pdf файлов с номерами газеты "Выль туйӧд" за 2011, 2013-2017 гг., полученных от редакции газеты.
3.2. Извлечения из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №26-29) и журнала "Йӧлӧга" (2022 №6), а также текстов двух номеров газеты "Выль туйӧд" за 2011 год (2011-01-05, 2011-01-14); обработка указанных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
3.3 Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) текстов номеров газет "Водзӧ" за январь 1946 года и "Выль Войвыв" за март-декабрь 1956 года.
3.4. Включение всех обработанных текстов в корпус коми языка, еженедельное обновление корпуса.
4. Текстовое пополнение молодцовского и латинского корпуса:
4.1. Сканирование и обработка в программе ABBYY FineReader сканов, создание pdf копий книжных изданий, предоставленных Национальной библиотекой Республики Коми: "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).
4.2. Сканирование ксерокопий дополнительных комиязычных номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, сделанных в Национальной библиотеке Республики Коми.
4.3. Создание фотокопий альманахов "Комі каԉенԁар" за 1923 и 1924 гг. в Национальном архиве Республики Коми.
4.4. Корректура оригинальных текстов изданий "1922. Комі јӧзлы каԉенԁар" (1921) и "Войвыв край овмӧс йылысь очеркъяс" (1932).
4.5. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice Writer текстов альманахов "Комі каԉенԁар" за 1923 и 1924 гг., книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933).
4.6. Загрузка в молодцовский (либо латинский) корпус текстов альманахов "Комі каԉенԁар" за 1922, 1923 и 1924 гг., книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и "Войвыв край овмӧс йылысь очеркъяс" (1932), а также текстов номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-09-23 и 1924-10-18.
5. Работа над пополнением коми-пермяцкого корпуса:
5.1. Извлечение из pdf файлов текстов коми-пермяцкого журнала "Лов шы" (2020-21) их обработка в программе LibreOffice (выравнивание абзацев, метаразметка, расстановка языковых тэгов) и загрузка в коми-пермяцкий корпус.
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Размещение текстов номеров газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11, 1924-09-23 и 1924-10-18 в переводе на современную графику в онлайн библиотеке "Коми гижӧд".
6.2. Перевод на современную графику текстов книжных изданий "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936), "J. I Pereļman. Gaⱬetnəj ļist. Eļektriçeskəj opьtjas" (1933) и "Войвыв край овмӧс йылысь очеркъяс" (1932), а также альманахов "Комі каԉенԁар" за 1922, 1924 и 1924 гг.; их повторная вычитка и размещение в онлайн библиотеке "Коми гижӧд" параллельно с текстами на оригинальной графике.
7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Создание и заполнение на справочном wiki-ресурсе "Коми тӧданін" отдельных страниц по книжным изданиям на коми языке: "Тӧвся Дуда (Е. Афанасьевалӧн 2022' вося небӧг)", "Челядьдырӧй, сё майбырӧй! (Э. И. Поляковалӧн 2022' вося небӧг)", "Аська, Петрушка, Тришка да мукӧд (2022' вося небӧг)", "Войвывса календар. Северный календарь (А. Сукгоевалӧн 2022' вося небӧг)", "Кӧні быдмӧ маръямоль. Где растёт маръямоль (А. Сукгоевалӧн 2022' вося небӧг)", "Ӧтисянь дасӧдз (2000ʼ вося небӧг)", "География (гырысьяслы, 1936’ вося небӧг)", "Газетнӧй лист: электрическӧй опытъяс (1933ʼ вося небӧг)", "География (4-ӧд класслы, 1939ʼ вося небӧг)", "1922 – сюрс ӧкмыссё кызь кыкӧд во (1922ʼ вося небӧг)", "Коми календар. 1923" и "Коми календар. 1924".
7.2. Создание ссылок со страниц изданий на страницы авторов и наоборот.
7.3. Пополнение погодовых списков книжных изданий, создание ссылок на новые страницы.
7.4. Пополнение библиографии коми периодики на сайте "Коми тӧданін" содержанием номеров газеты «Коми му» (2021. №52, 2022. №№1-26) и журнала «Йӧлӧга» (2021. №12, 2022. №№1-6).
7.5. Создание и заполнение wiki-страниц с оглавлением по номерам газеты "Југыԁ туј" за 1924-01-16, 1924-07-11, 1924-07-16, 1924-08-02, 1924-08-27, 1924-09-04, 1924-09-11 и 1924-10-18
8. Пополнение образовательного портала "Коми мутӧдӧм":
8.1. Создание модернизированной версии текстов по географии из издания "Географіја. Гырыԍјасӧс велӧԁан начаԉнӧј школалы учебԋік" (1936) и размещение обновленных текстов на портале "Коми мутӧдӧм".
9. Участие в мероприятиях:
9.1. Участие в подписании соглашения о взаимодействии с Национальной библиотекой РК.
10. Пополнение словарной базы средства проверки правописания Hunspell:
10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
11. Распространение комиязычного контента в соц. сетях.
12. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 9:51 22.07.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.18-2022.07.22
опубликовал Öньö Лав в 0:13 15.07.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.11-2022.07.15
опубликовал Öньö Лав в 20:18 07.07.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.07.04-2022.07.08
опубликовал Öньö Лав в 18:19 30.06.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.27-2022.07.01
опубликовал Öньö Лав в 14:45 27.06.2022
Надо восстановить опцию поиска по фольклору в молодцовском, латинском и пермяцком корпусах.
опубликовал Öньö Лав в 17:48 22.06.2022
=================3. Создание новых продуктов - 3 (в процессе):
1. Локализация сайтов.
1.1. Сбор материала для локализации муниципальных сайтов и сайтов государственных и муниципальных учреждений по ресурсам МО ГО Сыктывкар, Сысольского, Усть-Куломского, Ижемского и Печорского районов.
1.2. Перевод с русского языка на коми язык текстов сайтов администраций Сысольского (235887 зн.), Ижемского (143660 зн.), Печорского (39939 зн.) и Усть-Куломского районов (197892 зн.) Республики Коми для коми локализации и корпуса параллельных текстов.
2. Локализация программ.
2.1. Работы по локализации приложений операционной системы Simply Linux.
2.2. Перевод на коми язык глоссария данной ОС, предоставленного разработчиком (2139 строк).
3. Продолжение работы в рамках создания параллельного корпуса (kv-ru) для коми-русского и русско-коми переводчика:
3.1. Создание параллельного корпуса официальных текстов.
3.1.1. Распознавание в программе ABBYY FineReader русскоязычного контента издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996-1999) для корпуса параллельных текстов. Создание первичных (797 ед.) метаразметок к текстам документов для последующего выравнивания с коми переводами.
3.1.2. Сборка текстов новостной ленты официальных порталов Республики Коми на коми и русском языках за декабрь 2021 – февраль 2022 года; выравнивание коми и русского эквивалента в программе WinMerge. 1350 строк
3.2. Параллельный корпус текстов радионовостей.
3.2.1. Перевод с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 г. (240991 зн.) и 2019 г. (223948 зн.).
3.2.2. Сборка новостных текстов радио "Коми гор" за 2018, 2019 и 2020 гг. и создание метаразметок к текстам. Выделение в отдельный файл русскоязычного контента для дальнейшего выравнивания с коми эквивалентом.
3.2.3. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.
3.2.4. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
3.3. Выравнивание коми и русских текстов других форм.
3.3.1. Создание общих файлов tran_ru.txt и tran_kv.txt по собранным в 2021 году параллельным текстам художественной литературы на коми и русском языках, выравнивание строк в текстах указанных файлов в программе WinMerge. 84667 строк.
3.3.2. Создание файлов nt_ru.txt и nt_kv.txt c текстами Нового завета на коми и русском языках (предварительное устранение нумерации, несовпадающих заголовков и т. п., унификация формата в программе gedit), выравнивание текстов на двух языках в программе WinMerge. 9014 строк.
3.3.3. Сбор русскоязычного материала сайта "Изьватас" и его выравнивание с коми переводом для корпуса параллельных текстов. 1073 строк.
3.3.4. Выравнивание вновь переведенных текстов из учебника географии для 7 класса (2012) с русским оригиналом для корпуса параллельных текстов.
==============4. Пополнение и модернизация существующих электронных ресурсов - 12, в том числе:
1. Текстовое пополнение и оптимизация Корпуса коми языка:
1.1. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996 №11, 2002. №№1-5), книг О. И. Уляшев. "Кад пыр верзьӧмӧн" (2019), О. И. Уляшев. "Зарни бобув" (2021), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000), "Вильышпоз" (2000), сборника "Вын" (2022) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе ABBYY FineReader и создание pdf файлов.
1.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6, 8, 11).
1.3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного контента издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2001), текстов журналов "Войвыв кодзув" (1962 №1) и "Ударник" (1940 №№1-12), газеты "Колхозный труд" (май-сентябрь 1943 года), книг О. И. Уляшев "Зарни бобув" (2021), Е. А. Игушев. "Коми кывлӧн стилистика" (2003), "Долыд олан кад (1997), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Ӧтисянь дасӧдз" (2000), "Вильышпоз" (2000), и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".
1.4. Обработка (проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) ранее распознанных текстов: К. Королёв. "Важ нэмъяслӧн гусяторъяс" (2006) и №№2-12 журнала "Войвыв кодзув" за 1962 год;
1.5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№1-25), журналов "Войвыв кодзув" (2021 №№10-12, 2022. №№1-5) и "Йӧлӧга" (2021 №12, 2022 №1-5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
1.6. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986), их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
1.7. Вычитка и корректирование художественных текстов журнала "Войвыв кодзув" (№№ 7, 8, 11, 12 за 1975 г.), текстов произведений В. Юхнина (публицистические, литературоведческие и драматические произведения), Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988) и "Коми кывйыс гажаджык на биысь" (1998).
1.8. Сравнение и корректирование в программе Meld двух редакций романа В. Юхнина "Шувгӧны пожӧмъяс" (1961 и 2007 гг.).
1.9. Обработка текстов новостной ленты официальных порталов Республики Коми на коми языке за декабрь 2021 - февраль 2022 года (метаразметка, проверка текстов на орфографию в программе xed, сбор коми лексического материала для пополнения базы проверки правописания Hunspell).
1.10. Текущие исправления возникающих технических проблем функционирования корпуса.
1.11. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса. Объем корпуса на 22.06.2022 - 74 299 530 словоупотреблений.
2. Текстовое пополнение молодцовского корпуса:
2.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и добавление в молодцовский корпус текстов 40 комиязычных номеров газеты "Југыԁ туј" за январь-август 1924 г.
2.2. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).
2.3. Регулярное обновление корпуса. Объем корпуса на 22.06.2022 - 1 872 957 словоупотреблений.
3. Создание и пополнение коми-пермяцкого корпуса
3.1. Создание коми-пермяцкого раздела корпуса коми языка на основе текстов оригинальной художественной литературы (1921-2004 гг.).
3.2. Пополнение коми-пермяцкого корпуса текстами еженедельника "Кама кытшын" за 2019-22 гг., комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг., переводов на коми-пермяцкий язык по изданиям 1940-60 гг., учебников 1930-40 гг. и готовыми текстами молодцовского и латинского периода на современной графике. Метаразметка текстов.
3.3. Распознавание текста на коми латинице издания "Priroda tədmalan kꞑiga. 5-ət vo" (1932).
3.4. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
3.5. Регулярное обновление корпуса. Объем на 22.06.2022 - 6 134 914 словоупотреблений.
4. Пополнение онлайн библиотеки "Коми гижӧд":
4.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников.
4.2. Размещение в онлайн библиотеке текстов произведений В. Юхнина по изданиям "Висьтъяс да очеркъяс" (1961), "Дінъёльса вӧрпункт" (1983), "Герой йылысь сказ" (1945), а также текстов того же автора, опубликованных в журналах "Войвыв кодзув" и "Ударник".
4.3. Размещение в онлайн библиотеке текстов произведений Е. А. Игушева из изданий "Чужан кыв — менам олӧм да вӧт" (1988), "Коми кывйыс гажаджык на биысь" (1998) и "Коми кывлӧн стилистика" (2003).
4.4. Размещение в Коми онлайн библиотеке произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".
4.5. Размещение в онлайн библиотеке всех текстов комиязычных номеров газеты "Југыԁ туј" за январь-август 1924 года в переводе на современную графику.
4.6. Размещение в коми онлайн библиотеке «Коми гижӧд» (http://komikyv.org) аудиоматериала к текстам произведений коми писателей, предоставленного С. Г. Горчаковой (6-7 класс).
4.7. За отчетный период количество текстов в библиотеке возросло на 1001 единицу.
5. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
5.1. Создание и заполнение информационных wiki-страниц по 10 изданиям: "Дневник Николая Фёдоровича Терентьева" (2021), "Долыд олан кад" (1997), "Ӧтисянь дасӧдз" (2000), "Гажӧдчыштам" (2001), "Быдмӧм мывкыдӧн да авъяӧн" (2005), "Тӧдмӧдам челядьӧс вӧр-ваӧн" (2005), "Вильышпоз" (2000) , "Вын" (2022) и "Г. Бутырева. Ӧти бипур дорын" (2021), "М. А. Кастрен — Сибир туялысь (2014)"; пополнение библиографии на страницах авторов данных изданий.
5.2. Создание информационных wiki-страниц с содержанием 40 комиязычных номеров газеты "Југыԁ туј" за январь-август 1924 года с добавлением ссылок на тексты статей из этих номеров, размещенные в онлайн-библиотеке "Коми гижӧд".
5.3. Добавление ссылок на произведения, размещенные в онлайн-библиотеке "Коми гижӧд", с wiki-страниц авторов Е. А. Игушев, В. Лодыгин и В. Юхнин, А. Шомысова.
5.3. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
5.4. Внесение информации о корректуре на wiki-страницы, посвященных обработанным номерам издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. и №№2-12 журнала "Войвыв кодзув" за 1962 год на соответствующих wiki-страницах.
5.7. Добавление изображений на страницы wiki-ресурса "Коми тӧданін", посвященные отдельным изданиям (+10).
5.7. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".
5.5. Пополнение библиографии периодики содержанием номеров газеты «Коми му» (2021 г., № 39-52) и журнала «Йӧлӧга» (2021 г., № 9-11).
5.6. Дополнение указателя комиязычных публикаций в журнале "Арт" материалом №№1, 3, 4 за 2020 г., №№1-12 за 2021 гг., №№1, 2 за 2022 гг.
6. Пополнение лексической базы FU-Lab:
6.1. Сортировка объединенного списка названий организаций и учреждений, созданного по материалам выполненных заявок БОП за 2012–2021 гг.; обработка общего списка (устранение вновь выявленных повторов, уточнение названий по данным официальных сайтов), создание разметки xml и загрузка "Русско-коми словаря названий организаций и учреждений" (3224 словарные статьи) на сайт Онлайн словари FU-Lab, редактирование онлайн версии словаря, унификация подачи аналогичных случаев.
6.2. Сбор и перевод на коми язык дополнительных названий республиканских и муниципальных учреждений и организаций Республики Коми, а также названий их отделов и филиалов, не попавших в список, составленный по материалам выполненных заявок БОП за 2012–2021 гг.
6.3. Редактирование новых словарных статей для "Русско-коми словаря названий организаций и учреждений".
6.4. Выработка предложений для Коми РТОК по отдельным проблемам перевода.
7. Пополнение образовательного портала "Коми кыв"
7.1. Размещение на wiki-ресурсе образовательного портала "Коми кыв" текстов методических материалов О. И. Рочевой (6 изданий).
7.2. Сегментация в программе Sound Forge аудиматериала учебников Е. Н. Вязовой и А. В. Сизовой "Коми кыв" для 3 и 4 классов, привязка аудио к текстам учебника на сайте http://audio.komikyv.ru.
7.3. Создание и обработка (добавление аудиоссылок на имеющийся озвученный материал, создание списка фраз для озвучки) текста онлайн версии разговорника "Сёрнитыштам ёртӧй" (2021) для образовательного портала "Коми кыв", начало работы по добавлению к разговорнику аудиоматериала.
7.4. Пополнение тематических разделов Коми-русского разговорника FU-Lab за счет дополнительных слов и фраз, представленных в «Русско-коми разговорнике» 2021 года.
8. Пополнение лингвистического сайта "Коми кыв"
8.1. Создание и обработка wiki-версии издания "Секреты коми языка" (2020) на wiki-ресурсе "Коми лингвистика".
8.2. Размещение информационных материалов, освящающих события в секторе языка ИЯЛИ ФИЦ "КНЦ УрО РАН".
9. Пополнение образовательного сайта "Коми география":
9.1. Продолжение перевода текста учебника географии для 7 класса (2012), редактирование новых разделов и их размещение на сайте "Коми мутӧдӧм".
10. Пополнение коми аудиокорпуса:
10.1. Добавление в аудиобазу лаборатории файлов с выпусками радиопередачи "Миян кад" за ноябрь-декабрь 2021 г. и аудиофайлов с художественными текстами, предоставленными С. Г. Горчаковой.
11. Пополнение словарной базы средства проверки правописания Hunspell:
11.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение отчетного периода.
11.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
11.3. Обновление лексической базы коми (вариативного) спелера в Онлайн-сервисе проверки орфографии
12. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru
12.1. Добавление сервиса построчного сравнения файлов.
12.2. Добавление сервиса создания tmx-файлов.
+Распространение комиязычного контента в соц. сетях.
+Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
+Участие в мероприятиях:
опубликовал Öньö Лав в 11:41 22.06.2022
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:
2.1. Перевод с русского языка на коми язык текстов сайтов администраций Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Распознавание в программе ABBYY FineReader русскоязычного контента издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996-1999) для корпуса параллельных текстов. Создание первичных метаразметок к текстам документов для последующего выравнивания с коми переводами.
2.3. Выравнивание вновь переведенных текстов из учебника географии для 7 класса (2012) с русским оригиналом для корпуса параллельных текстов.
2.4. Работы по локализации приложений операционной системы Simply Linux, перевод на коми язык глоссария данной ОС, предоставленного разработчиком.
2.5. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.
2.6. Сборка новостных текстов радио "Коми гор" за 2020 г. и создание метаразметок к текстам. Выделение в отдельный файл русскоязычного контента для дальнейшего выравнивания с коми эквивалентом.
2.7. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.
2.8. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
3. Текстовое пополнение и оптимизация Корпуса коми языка:
3.1. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996 №11, 2002. №№1-5), сборника "Вын" (2022) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе ABBYY FineReader и создание pdf файлов.
3.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6, 8, 11).
3.3. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного контента издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2001), текстов журналов "Войвыв кодзув" (1962 №1) и "Ударник" 1940 (№№2-7, 10-12), газеты "Колхозный труд" (май-сентябрь 1943 года) и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".
3.4. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№13-25), журналов "Войвыв кодзув" (2021 №№10-12, 2022. №№15) и "Йӧлӧга" (2022. №№2-5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.5. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986), их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
3.6. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса.
3.7. Текущие исправления возникающих технических проблем функционирования корпуса.
4. Текстовое пополнение молодцовского корпуса:
4.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21,1924-05-24, 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25, 1924-07-02, 1924-07-05, 1924-07-19, 1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.
4.2. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).
5. Работа над пополнением коми-пермяцкого корпуса
5.1. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
5.2. Добавление в коми-пермяцкий корпус текстов газеты "Кама кытшын" за февраль-апрель 2022 гг. и комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг.
5.3. Пополнение коми-пермяцкого корпуса интернет-контентом за апрель-июнь 2022 г.
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников. (Всего 221 произведение).
6.2. Размещение в Коми онлайн библиотеке 116 произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".
6.3. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21,1924-05-24, 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25, 1924-07-02, 1924-07-05, 1924-07-19, 1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.
7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Создание и заполнение wiki-страниц по отдельным номерам газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21,1924-05-24, 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25, 1924-07-02, 1924-07-05, 1924-07-19, 1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20 и журнала "Войвыв кодзув" (1961. №1; 2021. №10-12; 2022. №№1-5).
7.2. Создание и заполнение wiki-страницы по книжному изданию "М. А. Кастрен — Сибир туялысь (2014)".
7.3. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
7.4. Отметки об исправлениях в обработанных номерах издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2001 гг. на соответствующих wiki-страницах.
7.5. Создание ссылок на тексты, размещенные в онлайн библиотеке "Коми гижӧд", со страниц авторов "Лодыгин Василий" и "Шомысова Алёна", а также соответствующих изданий.
7.6. Дополнение указателя коми публикаций в журнале "Арт" материалом №№1, 2 за 2022 гг.
7.7. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".
8. Пополнение сайта "Коми география":
8.1. Продолжение перевода текста учебника географии для 7 класса (2012), его редактирование и размещение на сайте "Коми мутӧдӧм".
9. Участие в мероприятиях:
9.1. Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ).
9.2. Участие в zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
9.3. Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).
9.4. Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).
9.5. Проведение вебинаров в Коми республиканском институте развития образование на тему "Автоматическая проверка правописания в процессе обучения коми языку" (2022-04-15) и "Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022-06-23).
10. Пополнение словарной базы средства проверки правописания Hunspell:
10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
11. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru
11.1. Добавление сервиса построчного сравнения файлов.
11.2. Добавление сервиса создания tmx-файлов.
12. Распространение комиязычного контента в соц. сетях.
13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 18:09 21.06.2022
2022.05.23 – 2022.06.24
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:
2.1. Продолжение перевода с русского языка на коми язык текстов сайтов администраций Сысольского, Ижемского и Усть-Куломского районов Республики Коми для коми локализации и корпуса параллельных текстов.
2.2. Распознавание в программе ABBYY FineReader русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1999. №№1-12) для корпуса параллельных текстов. Создание первичных метаразметок к текстам документов для последующего выравнивания с коми переводами.
2.3. Перевод трех параграфов учебника по географии для 7 класса (2012), редактирование перевода, размещение коми текстов на сайте "Коми мутӧдӧм", выравнивание коми перевода с оригиналом для корпуса параллельных текстов.
2.4. Продолжение работы над локализацией приложений операционной системы Simply Linux, перевод на коми язык глоссария данной ОС, предоставленного разработчиком.
3. Текстовое пополнение и оптимизация Корпуса коми языка:
3.1. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2022. №№21-25), журналов "Войвыв кодзув" (2022. №№4, 5) и "Йӧлӧга" (2022. №№4, 5); обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
3.2. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного контента издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№1-12).
3.3. Распознавание и вычитка в программе ABBYY FineReader комиязычного контента издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2002. №№ 1-2), текстов газеты "Колхозный труд" за май-сентябрь 1943 года и ранее нераспознанных произведений и переводов А. А. Шомысовой из журнала "Арт" и сборника "Медводдза муслун".
3.4. Распознавание и вычитка в программе ABBYY FineReader диалектных текстов издания "Висер вожса сьыланкывъяс да мойдкывъяс" (1986), их обработка в программе LibreOffice Writer и создание литературных редакций данных текстов.
3.5. Сканирование в программе ABBYY FineReader издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2002. №№1-5) и двуязчыного фольклорного издания "Шӧвк тупыль" (2012); обработка сканов в программе ABBYY FineReader и создание pdf файлов.
3.6. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Обновление корпуса.
4. Текстовое пополнение молодцовского корпуса:
4.1. Распознавание и вычитка в программе ABBYY FineReader, обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-07-05, 1924-07-19, 1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.
4.1. Создание текстовой копии молодцовского издания "Ԍурс ӧкмысԍо кыԅ кыкӧԁ во : комі јӧзлы каԉендар" (1922).
5. Работа над пополнением коми-пермяцкого корпуса
5.1. Пополнение коми-пермяцкого корпуса интернет-контентом за май-июнь 2022 г.
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Заключение лицензионного договора и размещение в онлайн библиотеке "Коми гижӧд" произведений и переводов А. А. Шомысовой из книг "Дзар" (2011), "Чӧв! (2012), журналов "Войвыв кодзув", "Арт" и коллективных сборников. (Всего 221 произведение).
6.2. Размещение в Коми онлайн библиотеке 75 произведений В. Г. Лодыгина из сборника "Лӧсас" (2013)".
6.3. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-07-05, 1924-07-19, 1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20.
7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Заполнение wiki-страниц по отдельным номерам газеты "Југыԁ туј" за 1924-07-05, 1924-07-19, 1924-07-23, 1924-07-26, 1924-07-30, 1924-08-06, 1924-08-09, 1924-08-13, 1924-08-16 и 1924-08-20 и журнала "Войвыв кодзув" (2022 №4-5).
7.2. Отметки об исправлениях в обработанных номерах издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 2001 г. на соответствующих wiki-страницах.
7.3. Создание ссылок на тексты, размещенные в онлайн библиотеке "Коми гижӧд", со страниц авторов "Лодыгин Василий" и "Шомысова Алена", а также соответствующих изданий.
7.4. Дополнение указателя коми публикаций в журнале "Арт" материалом №№1, 2 за 2022 гг.
8. Участие в мероприятиях:
8.1. Проведение вебинара в Коми республиканском институте развития образование на тему "Справочник по коми письменности «Коми тӧданін» в процессе обучения коми языку" (2022-06-23).
9. Пополнение словарной базы средства проверки правописания Hunspell:
9.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
9.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
10. Распространение комиязычного контента в соц. сетях.
11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 16:53 21.06.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.20-2022.06.24
опубликовал Öньö Лав в 18:39 16.06.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.13-2022.06.17
опубликовал Öньö Лав в 20:57 09.06.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.06.06-2022.06.10
опубликовал Öньö Лав в 11:59 02.06.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.30-2022.06.03
опубликовал Öньö Лав в 23:03 26.05.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.23-2022.05.27
опубликовал Öньö Лав в 17:41 20.05.2022
2. Работа в рамках создания параллельного корпуса (kv-ru), локализации сайтов и программ:
2.1. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2019 гг.
2.2. Выработка алгоритма автоматического разделения коми и русского материала в массивах новостных текстов радио "Коми гор".
2.3. Продолжение перевода на коми язык текстов сайтов администраций Сысольского и Усть-Куломского районов для коми локализации и корпуса параллельных текстов.
2.4. Распознавание и обработка в программе ABBYY FineReader русских текстов издания "Ведомости нормативных актов органов государственной власти Республики Коми" (1996. №№1-12; 1997. №№1-12; 1998. №№1-12). Создание первичных метаразметок к текстам документов для последующего выравнивания с коми переводами.
2.5. Начало работы над локализацией приложений операционной системы Simply Linux.
3. Текстовое пополнение и оптимизация Корпуса коми языка:
3.1. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022. №№17-20), обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.2. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№8, 11).
3.3. Распознавание и вычитка в программе ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№7-8, 11-12; 1998. №№1-12, 1999. №№1-12, 2000. №№1-12, 2001 №№3-7, 11).
3.4. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-8, 11-12, 1997. №№1-12;1998. №№1-12;1999. №№1-12, 2000. №№1-12).
3.5. Загрузка вновь распознанных и обработанных текстов в корпус коми языка. Еженедельное обновление корпуса.
4. Текстовое пополнение молодцовского корпуса:
4.1. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25 и 1924-07-02.
5. Работа над пополнением коми-пермяцкого корпуса
5.1. Извлечение из pdf файлов текстов газеты "Кама кытшын" (номера за апрель-сентябрь 2010 г.), первичная обработка текстов в программе xed.
5.2. Пополнение коми-пермяцкого корпуса интернет-контентом за апрель-май 2022 г.
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25 и 1924-07-02.
6.2. Размещение в Коми онлайн библиотеке 41 произведения В. Г. Лодыгина из сборника "Лӧсас" (2013)".
7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Заполнение wiki-страниц по отдельным номерам газеты "Југыԁ туј" за 1924-05-30, 1924-06-07, 1924-06-20, 1924-06-25 и 1924-07-02.
7.2. Отметки об исправлениях в обработанных номерах издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" за 1996-2000 гг. на соответствующих wiki-страницах.
7.3. Создание ссылок на тексты, размещенные в онлайн библиотеке "Коми гижӧд", со страниц автора "В. Г. Лодыгин" и издания "Лӧсас (2013)".
7.4. Пополнение таблиц по книжным изданиям на коми языке за 2019-2022 годы и создание ссылок для будущих wiki-страниц по отдельным изданиям на справочном wiki-ресурсе "Коми тӧданін".
7.5. Создание и заполнение wiki-страницы по книжному изданию "М. А. Кастрен — Сибир туялысь (2014)".
8. Участие в мероприятиях:
8.1. Участие в работе круглого стола "К 30-летию Закона Республики Коми "О государственных языках Республики Коми" (ГОУ ВО КРАГСиУ).
8.2. Участие в zoom-конференции "Роль языковых активистов и сообществ в сохранении языков" (2022.05.03).
8.3. Участие и выступление на научно-популярном форуме "Коми-пермяцкий язык. Прошедшее, настоящее и будущее время" (Кудымкар, 2002.05.17).
9. Пополнение словарной базы средства проверки правописания Hunspell:
9.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
9.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
10. Распространение комиязычного контента в соц. сетях.
11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 19:19 19.05.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.16-2022.05.20.
опубликовал Öньö Лав в 21:02 12.05.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.11-2022.05.13.
опубликовал Öньö Лав в 20:54 05.05.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.05.04-2022.05.06.
опубликовал Öньö Лав в 21:18 28.04.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.25-2022.04.29.
опубликовал Öньö Лав в 15:58 22.04.2022
2. Сбор, создание и обработка параллельных текстов (пара коми-русский) в рамках создания параллельного корпуса (kv-ru) и локализации сайтов:
2.1. Продолжение перевода с коми языка на русский текстов в жанре "репортаж" по материалам радио "Коми гор" за 2018 и 2019 гг.
2.2. Сборка новостных текстов радио "Коми гор" за 2020 г. и создание метаразметок к текстам. Выдление в отдельный файл русскоязычного контента для дальнейшего выравнивания с коми эквивалентом.
2.3. Правка новостных текстов радио "Коми гор" за 2017 г., создание метаразметок и разделение массива текстов на параллельные файлы с коми и русскоязычным контентом.
2.4. Начало перевода на коми язык текстов сайта администрации Сысольского района для коми локализации и корпуса параллельных текстов.
3. Текстовое пополнение и оптимизация Корпуса коми языка:
3.1. Извлечение из pdf файла текстов свежих номеров газеты "Коми му" (2022 №№13-16), журналов "Йӧлӧга" (2022. №№2, 3) и "Войвыв кодзув" (2021 №№10-12, 2022. №№1-3), обработка данных текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка.
3.2. Распознавание в программе ABBYY FineReader, обработка текстов в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка текстов журнала "Ударник" 1940 (№№2-7, 10-12).
3.3. Обработка в программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов) и загрузка в корпус коми языка комиязычного текста издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" (1996. №10, 2021. №№1-2) и журнала "Войвыв кодзув" (1962 №1).
3.4. Распознавание в программе ABBYY FineReader коми текстов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996. №№1-6, 10; 1997. №№1-12).
3.5. Сканирование, обработка сканов в программе ABBYY FineReader и создание pdf версий сборника "Вын" (2022) и №11 издания "Коми Республикаса государственнӧй власть органъяслӧн индӧд-тшӧктӧмъяс" за 1996 год.
3.6. Обработка в программе ABBYY FineReader ранее полученных сканов издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (2001. №№4-6).
4. Текстовое пополнение и оптимизация молодцовского корпуса:
4.1. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21 и 1924-05-24.
5. Работа над пополнением коми-пермяцкого корпуса
5.1. Добавление в коми-пермяцкий корпус текстов газеты "Кама кытшын" за февраль-апрель 2022 гг. и комиязычных текстов "Югӧр_чукӧр" за 2014-2022 гг.
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Размещение в Коми онлайн библиотеке "Коми гижӧд" в переводе на современную графику текстов комиязычных номеров газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21 и 1924-05-24.
7. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
7.1. Заполнение wiki-страниц по отдельным номерам журнала "Войвыв кодзув" (1961. №1; 2021. №10-12; 2022. №№1-3) и газеты "Југыԁ туј" за 1924-05-01, 1924-05-05, 1924-05-09, 1924-05-14, 1924-05-21 и 1924-05-24.
7.2. Создание wiki-страниц по номерам журнала "Ударник" (1940. №1-12) и издания "Коми Республикаса государственнӧй власьт органъяслӧн индӧд-тшӧктӧмъяс" (1996-2002).
8. Работа с практикантами
8.1. Работа с практикантами - студентами Института точных наук и информационных технологий ФГБОУ ВПО "Сыктывкарский государственный университет им. Питирима Сорокина".
9. Участие в мероприятиях
9.1. Онлайн участие двух сотрудников в мероприятии: "Весенняя школа по сохранению, развитию и возрождению языков" (22–24 апреля 2022 г., Институт языкознания РАН, Москва).
9.2. Проведение вебинара в Коми республиканском институте развития образование на тему "Автоматическая проверка правописания в процессе обучения коми языку" (2022-04-15).
10. Добавление олайн-сервисов в раздел "Инструменты" сайта fu-lab.ru
10.1. Добавление сервиса построчного сравнения файлов.
10.2. Добавление сервиса создания tmx-файлов.
11. Пополнение словарной базы средства проверки правописания Hunspell:
10.1. Сбор новой лексики из коми текстов, обработанных в лаборатории в течение месяца.
10.2. Сортировка и индексация новой лексики, включение ее в коми словарную базу вариативной версии Hunspell.
12. Распространение комиязычного контента в соц. сетях.
13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 19:23 21.04.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.18-2022.04.22.
опубликовал Öньö Лав в 20:08 14.04.2022
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 2022.04.11-2022.04.15.