опубликовал Öньö Лав в 14:33 24.11.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 22.11.2021–26.11.2021.
опубликовал Öньö Лав в 18:05 18.11.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 15.11.2021–19.11.2021.
опубликовал Öньö Лав в 11:07 11.11.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 08.11.2021–12.11.2021.
2. Продолжение выравнивания текстов официально-делового стиля (постановления правительства РК) на коми и русском языках из файлов БОП, содержащих НПА РК за 2013 г.
3. Завершение выравнивания и объединение текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 г.
4. Проверка текстов, указанных в п. 2 и 3 в программе xed с помощью спелл-чекера hunspell, корригирование орфографии и сбор нового лексического материала.
5. Извлечение из pdf файлов текстов свежих номеров газеты "Коми му" (2021 №№44, 45) и их обработка программе LibreOffice (выравнивание абзацев, проверка орфографии, выявление новой лексики, метаразметка, расстановка языковых тэгов).
6. Пополнение словарной базы коми спелл-чекера hunspell новой лексикой из текстов, указанных в п. 2, 3 и 5.
7. Добавление в корпус коми языка текстов, указанных в п. 3 и 5. Обновление корпуса.
8. Продолжение работы по сравнению в программа Meld редакций прозаических текстов корпуса в целях устранения оставшихся после распознавания опечаток (повести Г. Юшкова).
9. Добавление в молодцовский корпус текстов комиязычных номеров газеты "Југыԁ туј" за 1923-12-01 и 1923-12-05, включение данных текстов в переводе на современную графику в онлайн библиотеку "Коми гижӧд".
10. Распространение комиязычного контента в соц. сетях.
11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 20:24 02.11.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 01.11.2021–03.11.2021.
2. Предварительная обработка, метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2013 г.
3. Выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 г.
4. Извлечение из pdf файла текстов свежего номера журнала "Йӧлӧга" (2021 №10) и их обработка (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов).
5. Работа со студентами СГУ по их участию в созданий корпуса параллельных текстов (kv-ru) в части новостных публикаций портала rkomi.ru
6. Продолжение работы по сравнению в программа Meld редакций прозаических текстов в целях устранения оставшихся после распознавания опечаток (повести Г. Юшкова).
7. Распространение комиязычного контента в соц. сетях.
8. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 20:56 28.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 25.10.2021–29.10.2021.
2. Завершение сборки и начало предварительной обработки текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2013 г. для дальнейшей метаразметки и выравнивания.
3. Завершение предварительной обработки и разметка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2014 г. для дальнейшего выравнивания.
4. Извлечение из pdf файла текстов свежего номера газеты "Коми му" (2021 №43), их обработка (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов) и включение в корпус коми языка.
6. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1923-11-28, включение данных текстов в переводе на современную графику в онлайн библиотеку "Коми гижӧд".
7. Пополнение словарной базы коми спелл-чекера hunspell новой лексикой из текстов, включенных в корпус коми языка в текущем месяце.
8. Возобновление работы по сравнению в программе Meld редакций прозаических текстов в целях устранения оставшихся после распознавания опечаток (повести Г. Юшкова).
9. Внесение исправлений в словарь пейоративной лексики "Коми видчанкывъяс" на сайте Онлайн словари FU-Lab, работа со студентами-филологами СГУ по их участию в переводе иллюстративных примеров данного словаря.
10. Работа со студентами СГУ по их участию в созданий корпуса параллельных текстов (kv-ru) в части новостных публикаций портала rkomi.ru
11. Ознакомление слушателей курсов коми языка, проводимых в ГАУ РК "ДДН РК", с возможностями образовательного портала "Коми кыв" и других ресурсов, облегчающих освоение коми языка лицами, не являющимися его носителями.
12. Тестовое создание tmx-файла для разработки системы автоматизированного перевода.
13. Распространение комиязычного контента в соц. сетях.
14. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 12:31 22.10.2021
2. Подготовка к созданию корпуса параллельных текстов (пара коми-русский):
2.1. Сборка, обработка, метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2012, 2015, 2016, 2019 гг. и январь-апрель 2021 г.
2.2. Сборка и обработка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2013, 2014 гг.
2.3. Выравнивание параллельных текстов на коми и русском языках в программе WinMerge по изданию П. Бажов "Сказъяс" (1953) и соответствующим русскоязычным публикациям.
3. Текстовое пополнение и техническая оптимизация Корпуса коми языка:
3.1. Извлечение из pdf файлов, обработка (выравнивание абзацев, проверка орфографии, метаразметка, расстановка языковых тэгов), перепроверка и включение в корпус коми языка текстов газеты "Коми му" (2021 №№39-42), журналов "Войвыв кодзув" (№№2-9 за 2021 г.) и "Йӧлӧга" (2021 №9).
3.2. Сборка, обработка (проверка орфографии, метаразметка, расстановка языковых тэгов), перепроверка и и включение в корпус коми языка текстов новостных порталов РК за август-сентябрь 2021 года и сайта "Изьватас".
3.3. Сканирование, создание pdf файла, распознавание, обработка (проверка орфографии, метаразметка, расстановка языковых тэгов), перепроверка и и включение в корпус коми языка текстов изданий: Зарни Люся. Шоныдін (2018), А. Шебырев. Фараон (2019)
3.4. Перепроверка и включение в корпус коми языка текстов нормативно-правовых актов РК за 2012, 2015, 2016, 2019, 2020 г.
3.5. Увеличение лимита выдачи результата до 10 000 единиц при поиске по фразе в корпусе коми языка.
3.6. Устранение случаев нестандартной кодировки в корпусе коми языка.
3.7. Решение проблемы неверной разбивки на предложения в корпусе коми языка (заглавная Ё в начале предложение, две заглавные в конце предложения, знак •, сочетание типа " Б. — "), а также проблемы с тегами <about>
3.8. Подключение виртуальной клавиатуры к корпусу коми языка
4. Текстовое пополнение и оптимизация молодцовского корпуса:
4.1. Добавление в молодцовский корпус коми текстов газеты "Југыԁ туј" за январь-октябрь 1923 года.
4.2. Добавление в молодцовский корпус текстов комиязычного номера газеты "Југыԁ туј" за 1923-11-24.
4.3. Разработка и подключение виртуальной клавиатуры к молодцовскому корпусу коми языка
5. Библиографическое пополнение справочного wiki-ресурса "Коми тӧданін":
5.1. Пополнение библиографии газетных и журнальных публикаций на коми языке: (газета "Коми му" №№12-39 за 2021 г., журнал "Йӧлӧга" №№2-12 за 2020 и №№1-8 за 2021 гг., журнал "Войвыв кодзув" №№2-9 за 2021 г.)
5.2. Пополнение библиографии книжных публикаций на страницах изданий: В. Е. Напалков. "Ӧттор-мӧдтор йылысь" (2021)", А. Шебырев. "Фараон" (2019), Людмила Втюрина. "Шоныдін" (2018) Г. Попов. "Мича гудӧк" (2017), создание гиперссылок к тем произведениям из данных изданий, которые размещены в онлайн библиотеке "Коми гижӧд".
6. Пополнение онлайн библиотеки "Коми гижӧд":
6.1. Размещение в коми онлайн библиотеке произведений автора Зарни Люся. Размещено 82 произведения из книжных изданий и 15 из журнальных публикаций.
6.2. Размещение в коми онлайн библиотеке произведений Г. И. Попова из издания "Мича гудӧк" (2017). Размещено 35 произведений.
6.3. Размещение в коми онлайн библиотеке текстов газеты Југыԁ туј за январь-ноябрь 1923 г. в переводе на современную графику.
7. Пополнение и модернизация сайта "Онлайн словари FU-Lab":
7.1. Обработка текста и разметка словаря пейоративной лексики коми языка "Коми видчанкывъяс" (2021), размещение содержимого данного словаря на сайте Онлайн словари FU-Lab
7.2. Разработка и подключение виртуальной клавиатуры к сайту "Онлайн словари FU-Lab"
8. Пополнение базы образовательного портала "Коми география":
8.1. Редактирование текстов по отечественной географии из коми учебников 1937, 1957 и 1959 гг. (разделы "территория и границы", "рельеф", "Дальний Восток"), размещение их на портале "Коми география".
8.2. Сканирование и распознавание изданий География Коми АССР. 7 класс (1987); География. 7 класс (2021), Коми - наш родимый край (2021) для пополнения текстовой базы ресурса "Коми география".
8.3. Работа по созданию аудиопрезентации по геологии Тимана на коми языке для сайта "Коми география".
9. Восстановление функциональности серверов ЦИЯТ после их отключения 8-10/Х-2021 г. и устранение возникших на сайтах проблем, связанных с перерывом в работе серверов.
10. Распространение комиязычного контента в соц. сетях.
11. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 10:39 22.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 18.10.2021–22.10.2021.
опубликовал Öньö Лав в 10:33 18.10.2021
Параллель нога официоз (визь - кылаин)
Параллель нога художка:
опубликовал Öньö Лав в 17:54 14.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 11.10.2021–15.10.2021.
опубликовал Öньö Лав в 10:15 13.10.2021
опубликовал Öньö Лав в 16:48 11.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 04.10.2021–08.10.2021.
1. Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2015 год для дальнейшего редактирования, метаразметки и выравнивания.
2. Сборка, редактирование и метаразметка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2016 год для дальнейшего выравнивания.
3. Редактирование, метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за январь-апрель 2021 года.
3. Выравнивание в программе WinMerge дополнительных текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за за 2012 год.
4. Сканирование изданий: География Коми АССР. 7 класс. 1987; География. 7 класс. 2021; Зарни Люся. Шоныдін. 2018
5. Распознавание в программе ABBYY FineReader изданий: География Коми АССР. 7 класс. 1987; География. 7 класс. 2021; Зарни Люся. Шоныдін. 2018; Зарни Люся. Олӧмлы ода. 2014.
6. Размещение произведений автора Зарни Люся в коми онлайн библиотеке. Размещено 82 произведения из книжных изданий и 15 из журнальных публикаций.
7. Создание гиперссылок на сайте "Коми тӧданін" к произведениям, указанным в п. 6.
8. Работа по созданию аудиопрезентации по геологии Тимана на коми языке для сайта "Коми география".
9. Извлечение из pdf файлов текстов журнала "Войвыв кодзув" (№№2-9 за 2021 г.). Начало обработки данных текстов: выравнивание абзацев, проверка орфографии, метаразметка, языковые тэги, оформление на сайте
10. Извлечение/сборка и обработка текстов газеты "Коми му" (2021 №40), журнала "Йӧлӧга" (2021 №9), сайта "Изьватас" и актуальных текстов новостных порталов РК для включения в корпус коми языка.
11. Включение указанных в п. 10 текстов, а также дополнительных текстов НПА РК за 2012 г. в базу корпуса коми языка. Обновление корпуса.
12. Распространение комиязычного контента в соц. сетях.
13. Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 16:48 11.10.2021
В общий отчет по ЦИЯТ ГАУ РК "ДДН РК" от FU-Lab за период 27.09.2021–01.10.2021.
1. Сборка текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2016 год для дальнейшего выравнивания.
2. Метаразметка и выравнивание в программе WinMerge текстов официально-делового стиля на коми и русском языках из файлов БОП, содержащих НПА РК за 2019 г. и 2012 г.
3. Выравнивание параллельных текстов на коми и русском языках в программе WinMerge по изданию П. Бажов "Сказъяс" (1953) и соответствующим русскоязычным публикациям.
4. Подготовка текста издания Коми му_2021_№39 и актуальных текстов новостных порталов РК для включения в корпус коми языка.
5. Включение указанных в п. 4. текстов, а также текстов нормативно-правовых актов РК за 2019 г. в корпус коми языка; обновление корпуса.
6. Библиографирование издания "Ӧттор-мӧдтор йылысь (В.Е.Напалковлӧн 2021' вося небӧг)" и создание ссылок на страницах писателей в ресурсе http://wiki.komikyv.org.
7. Пополнение библиографии газетных публикаций на сайте "Коми тӧданін"
*газета "Коми му" №№12-39 за 2021 г.
*журнал "Йӧлӧга" №№2-12 за 2020 и №№1-8 за 2021 гг.
Иное:
Распространение комиязычного контента в соц. сетях.
Помощь пользователям по установке коми раскладки клавиатуры и иных программ поддержки коми электронной письменности.
опубликовал Öньö Лав в 20:01 10.10.2021
опубликовал Öньö Лав в 17:51 30.09.2021
опубликовал Öньö Лав в 10:36 14.09.2021
опубликовал Öньö Лав в 13:27 07.08.2021
опубликовал Öньö Лав в 12:42 05.08.2021
+ Заканчивается оплата имени komikyv.org.
опубликовал Öньö Лав в 16:20 17.06.2021
+В Linux Mint накопилось множество обновлений, но они не устанавливаются.
опубликовал Öньö Лав в 17:11 13.05.2021
+ Необходимо сделать маркерами конца предложения такие сочетания:
!.. ?.. !» ...» ?» ... (два вида) ... — . —
опубликовал Öньö Лав в 16:04 04.05.2021
Номера большинства коми газет до 2010 года не сохранялись как пдф, только .P65 (PageMaker). Нужен конвертер с этого формата в pdf для последующего экспорта текстового слоя.
опубликовал Öньö Лав в 19:11 01.05.2021
опубликовал Öньö Лав в 11:24 27.04.2021
опубликовал Öньö Лав в 16:11 25.11.2020
опубликовал Öньö Лав в 21:33 11.11.2020
опубликовал Öньö Лав в 11:08 22.10.2020
опубликовал Öньö Лав в 10:03 21.10.2020
В коми корпусе надо в исключения добавить <koi>.
В корпусе поиск по фразе осуществляется очень-очень медленно, а временами заканчивается безрезультатно.
В кратком коми-русском топонимическом словре не работают ссылки и синонимы (Междуреченск, Изьвавом).
Надо оплатить komikyv.com макхосту.
опубликовал Öньö Лав в 11:07 08.10.2020
Йирым 5ʼ лунӧ вӧчим шыпаспӧв тэчасног нивхъяслы. Лунтыр выльмӧдім Коми кыв корпус.
Йирым 6ʼ лунӧ петіс уджавны Катюша. Содтіс Коми муяс да Йӧлӧгаяс. Ветлі Бикиньясла Маршак небӧгаинӧ.
Йирым 7ʼ лунӧ петіс уджавны Иннуш. Торйӧдалӧ быдмӧг-пемӧс зонаяс. Катюша сканераліс Сӧлӧ баб гижӧдъяса Би киньяс. Микӧ Вӧля вайӧдліс 6 студентӧс (4-ӧд курс), кутасны отсасьны миянлы (30 час: кыкӧн текстасясны, кыкӧн шыӧдасны кывъяс да куимӧн сканерасясны).
опубликовал Öньö Лав в 15:35 01.10.2020
Аттрибут "Орфографическая форма" перемещаем в раздел "Вариативность".
В раздел вариативность добавляем аттрибут "Орфографический вариант":
ВАРИАТИВНОСТЬ
ortho - орфографическая форма
ovar - орфографический вариант
ovarv
mvar - морфологический вариант
mvarv
fvar - фонетический вариант
fvarv
var - словообразовательный вариант (?)
varv
Выбор вариантов:
опубликовал Öньö Лав в 18:55 30.09.2020
По браузерному словарю: в wiki-инструкции сделали ссылку на магазин расширений Microsoft Edge.
По интегральному словарю: из списка незафиксированных в словарях слов удалены лексемы, присутствующие в диалектном двухтомнике; в онлайн инструментах появилась возможность поиска по xml-ке; стало отражаться её название; создана возможность добавлять и удалять статью; в новых словах обеспечено сохранение аттрибутов.
По латинской раскладке: в версии для Windows заменили нестандартный дефис стандартным (U+2010 > U+002d).
опубликовал Öньö Лав в 9:16 12.08.2020
По мнению пользователей, при поиске не надо учитывать регистр.