Газеты нулевых

опубликовал Öньö Лав в 16:04 04.05.2021

Номера большинства коми газет до 2010 года не сохранялись как пдф, только .P65 (PageMaker). Нужен конвертер с этого формата в pdf для последующего экспорта текстового слоя.

Проблемы корпуса

опубликовал Öньö Лав в 19:11 01.05.2021

  • В корпусе не происходит разбивка в случае "). ". Пример при поиске по "морт" в "Медым судзсьымӧн овны / Kodko // Коми му (2021-05-27)".
  • +В корпусе проблема с инциалами. Происходит обрыв предложения по точке после каждого из инициалов.
  • +В корпусе рядом с кавычками «» искомое слово не выделяется красным цветом.
  • +В корпусе при сортировке по тексту в конце добавляются предложения с ―,  “,  •, …  . Их надо игнорировать.
  • +В корпусе не действуют исключающие теги <dict></dict> , <list></list>, их надо прописать туда, где <table></table>.
  • +В корпусе при сортировке не формат (2010-10-15 и 2010. №1) понимается как формат 2010 и соответственно по месяцу и дню сортировка не происходит. Желательно учитывать день и месяц, при этом 2010. №1 можно технически заменить на 2010-01-00 и т. д.
  • +Если в корпусе будет реализован предыдущий пункт, можно по умолчанию поставить результат поиска с сортировкой по дате в убывающем порядке (свежие даты - первые).
  • В корпусе не работает сортировка по источнику.
Апрель пом.

опубликовал Öньö Лав в 11:24 27.04.2021

  • +Надо новую версию портала на geography.komikyv.org
  • +Надо обновить Корпус коми языка
  • Коми войтыр: культура да история йылысь дженьыд серпаскывъяс (2008)-ын небӧгын абуӧсь чутікъяс.
Выль проблэмз

опубликовал Öньö Лав в 16:11 25.11.2020

  • +В корпусе предложения опять начали делиться по точке после инициала.
  • +В корпусе поиск по фразе не работает
По диалектному словарю

опубликовал Öньö Лав в 21:33 11.11.2020

  1. Цифирь
  2. В списке слов не отражается пробел между ex и ex_tr
  3. В списке оставлять только строчки с искомым словом, если не в заголовке.
  4. Вот здесь  в шестом пункте вместо "У.-И. пу розь" получилось "И. пу розь У.-". Это результат недоисправлений косяков на ранних этапах - в исходнике тот же косяк.
Вежонся удж

опубликовал Öньö Лав в 11:08 22.10.2020

  • 2020-10-16 Коми кыв корпусӧ содтӧма «Коми му» (2020), кывъяс спеллер кывкудйӧ.
  • 2020-10-18 Коми кыв корпусӧ содтӧма Адольф Туркин (1986), кывъяс спеллер кывкудйӧ (топонимъясысь ӧтдор).
  • 2020-10-19. Коми кыв корпусӧ содтӧма Святӧй Евангелльӧяс (1992). Рытнас волісны кык студентка аудио гижны (Елкина Светлана да Канева Эмилия). Драйвер жугалі. Лыдди налы лекция коми кывнас ӧнія ситуация кузя.
  • 2020-10-20. Коми кыв корпусын унифицируйтӧма небӧг пас ==n. Коми кыв корпусӧ содтӧма Нина Обрезкова (2017). Рытнас волісны кык студентка: Чупрова Олеся сканируйтіс Мишарин (2016) - колӧ выльысь вӧчны некымын лист бок, Трофимова Диана тексталіс 96 лист бок КЧА-1 (2009). Норасисны норма вылӧ.
  • 2020-10-21. Коми кыв корпусӧ содтӧма Вера Латышева (1995, 1997, 1999, 2012), кывъяс спеллер кывкудйӧ. Маршак небӧгаинысь босьтӧма «Бикиньяс» (1999-2004) сканируйтӧм могысь.
  • 2020-10-22. Коми кыв корпусӧ содтӧма Алексей Попов (1990, 1994, 2001, 2002, 2005, 2008, 2011, 2013). Рытнас сканируйтӧма 1999ʼ да 2000ʼ вося «Бикиньяс».
  • 2020-10-23. Коми кыв корпусӧ содтӧма Коми челядьлы антология (куимнан том), кывъяс спеллер кывкудйӧ. Спеллер кывкудйӧ содтӧма тшӧтш кывъяссӧ Обрезкова (2017)-ысь. Босьтчи вӧчны 1999ʼ вося Бикинь пдфкаяс.

 

Проблэмз

опубликовал Öньö Лав в 10:03 21.10.2020

В коми корпусе надо в исключения добавить <koi>.

В корпусе поиск по фразе осуществляется очень-очень медленно, а временами заканчивается безрезультатно.

В кратком коми-русском топонимическом словре не работают ссылки и синонимы (Междуреченск, Изьвавом).

Надо оплатить komikyv.com макхосту.

НИВХ ДИФ

опубликовал Öньö Лав в 11:07 08.10.2020

Йирым 5ʼ лунӧ вӧчим шыпаспӧв тэчасног нивхъяслы. Лунтыр выльмӧдім Коми кыв корпус.

Йирым 6ʼ лунӧ петіс уджавны Катюша. Содтіс Коми муяс да Йӧлӧгаяс. Ветлі Бикиньясла Маршак небӧгаинӧ.

Йирым 7ʼ лунӧ петіс уджавны Иннуш. Торйӧдалӧ быдмӧг-пемӧс зонаяс. Катюша сканераліс Сӧлӧ баб гижӧдъяса Би киньяс. Микӧ Вӧля вайӧдліс 6 студентӧс (4-ӧд курс), кутасны отсасьны миянлы (30 час: кыкӧн текстасясны, кыкӧн шыӧдасны кывъяс да куимӧн сканерасясны).

Йирым тан.

опубликовал Öньö Лав в 15:35 01.10.2020

Аттрибут "Орфографическая форма" перемещаем в раздел "Вариативность".
В раздел вариативность добавляем аттрибут "Орфографический вариант":

ВАРИАТИВНОСТЬ

ortho - орфографическая форма
ovar - орфографический вариант
ovarv
mvar - морфологический вариант
mvarv
fvar - фонетический вариант
fvarv
var - словообразовательный вариант (?)
varv

Выбор вариантов:

 

Сентябр пом

опубликовал Öньö Лав в 18:55 30.09.2020

По браузерному словарю: в wiki-инструкции сделали ссылку на магазин расширений Microsoft Edge.

По интегральному словарю: из списка незафиксированных в словарях слов удалены лексемы, присутствующие в диалектном двухтомнике; в онлайн инструментах появилась возможность поиска по xml-ке; стало отражаться её название; создана возможность добавлять и удалять статью; в новых словах обеспечено сохранение аттрибутов.

По латинской раскладке: в версии для Windows заменили нестандартный дефис стандартным (U+2010 > U+002d).

По словарю dict.komikyv.ru

опубликовал Öньö Лав в 9:16 12.08.2020

По мнению пользователей, при поиске не надо учитывать регистр.

По молодцовскому конвертеру.

опубликовал Öньö Лав в 18:37 03.08.2020

  1. При конвертации с молодцовицы на современную графику начальная і присоединяется к предыдущему слову.
  2. При конвертации с молодцовицы на современную графику сочетание ІЈ вместо ИЙ дает ІІ.
  3. При конвертации с молодцовицы на современную графику сочетание [Је вместо [Е дает [ъЕ, сочетание [Ја вместо [Я дает [ъЯ и т. п.
  4. При конвертации с молодцовицы на современную графику сочетание [Е вместо [Э дает [Е.
  5. При конвертации с молодцовицы на современную графику сочетание [І вместо [И дает [І.
2020-07-30 лунся

опубликовал Öньö Лав в 12:37 30.07.2020

Инна файлъяс серти вежӧма Н. Куратовалысь гижӧдъяс ККК-ысь, унджыклаӧ колӧ бӧр содтыны юриндалысьяс. Мыйлакӧ корпусын бара лоины ЛОН-яс.

По Молодцов корпусу

опубликовал Öньö Лав в 13:44 11.07.2020

  • При поиске по лемме не ищет слова, начинающиеся с буквы в верхнем регистре (ТО ЖЕ САМОЕ И В ОСНОВНОМ КОРПУСЕ!).
  • Расширение вправо-влево подключает рандомные (?) тексты из основного корпуса.
  • Разбивка на предложения не действует, если первая или последняя буква - молодцовская.
По небӧгаину

опубликовал Öньö Лав в 17:29 09.07.2020

В разделе "Тема гижӧд" желательно сделать поиск по автору, по переводчику и по источнику. Сейчас только по названию произведения.

Дилектный словарь

опубликовал Öньö Лав в 13:44 09.07.2020

1. Заменить тильду "~" на содержимое <term></term>

2. Если внутри <ex></ex> есть запятая c предшествующей точкой ".," или закрывающей скобкой ")," , то эту запятую надо заменить на  </ex><ex>, а каждому примеру добавить один и тот же <ex_tr></ex_tr> , пример:
было

<ex>~ няня вв. (Мор.), ~ жытьник вв. (П.), ~ жытьнича</ex> <ex_tr>житница, амбар</ex_tr>

будет

<ex>~ няня вв. (Мор.)</ex> <ex_tr>житница, амбар</ex_tr>

<ex> ~ жытьник вв. (П.)</ex> <ex_tr>житница, амбар</ex_tr>

<ex> ~ жытьнича</ex> <ex_tr>житница, амбар</ex_tr>

3. Сформировать уровни <example> и <exam>

4. Все названия диалектов переносятся в <exam> в качестве аттрибута dial="". При этом ориентируемся на сокращенные названия диалектов

вв.
вс.
вым.
иж.
лл.
нв.
печ.
скр.
сс.
уд.


Если после этого названия есть текст в скобках, то он переносится вместе с названием диалекта.

5. Оставшиеся названия говоров переносятся в <exam> в качестве аттрибута dial="". При этом ориентируемся на сокращенные названия говоров

 

 

 

 

Краткий перечень дел до отпуска

опубликовал Öньö Лав в 19:32 03.07.2020

  • +Создание механизма загрузки корпусов
  • +Починка поиска по лемме в корпусе
  • +Починка загрузки в контекстном словаре
  • Оформление  разделов в рабочем интерфейсе интегрального словаря
  • Премещение названией диалектов в exam в диалектном словаре
  • +Переоформление тематических табличек второго плана в библиотеке
Косячок

опубликовал Öньö Лав в 18:43 25.06.2020

В прошлый раз не прокатило поднять ";". Теперь придется это сделать с новым условием. Все строки, начинающиеся с <ex> в которых нет последовательности </ex> <ex_tr> поднимаем без тэгов в предыдущую строку перед </t> или </ex_tr> (в зависимости от того, что там было в конце), отделив от предыдущего текста точкой с запятой ";".

 

Пример.

Сейчас:
<line>
    <term>алаа</term>
    <defn fut="">
        <mean dial="иж.">
            <t>толково</t>
                <ex>красиво</ex_tr>
                <ex>~ сёрнитны</ex> <ex_tr>толково разговаривать</ex_tr>
        </mean>
    </defn>
</line>

 

Надо:
<line>
    <term>алаа</term>
    <defn fut="">
        <mean dial="иж.">
            <t>толково; красиво</t>
                <ex>~ сёрнитны</ex> <ex_tr>толково разговаривать</ex_tr>
        </mean>
    </defn>
</line>

В диалектный словарь

опубликовал Öньö Лав в 18:18 22.06.2020

  1. +Все содержимое от <p> до тире "—" и пробела за ним перемещаем в вышестоящий <mean>, в качестве содержимого аттрибута dial="", при этом само тире с последующим пробелом удаляется.
  2. +Выявляем все строки, где более одного "—" . Комментим лишние "—" .
  3. Все строчки, содержащие <ex> и не содержащие тире "—", добавляем через точку с запятой "; " к предыдущей строке.
  4. +Во всех строках, начинающихся с <ex> меняем "—" на "</ex> <ex_tr>", а в конце строки добавляем "</ex_tr>".
  5. +Закрываем тегом </p> строки, начинающиеся с <p>.
  6. +Все содержимое <p>, начинающееся со фразы "то же, что ", переносим в вышестоящий <mean> в качестве содержимого аттрибута link="", при этом надо бы решить проблему типа "во 2 знач."
  7. +Приводим к верхнему регистру содержимое <term></term>.
  8. +Убрираем содержимое атрибута fut="" (сам атрибут оставляем).
По dict.fu-lab.ru

опубликовал Öньö Лав в 19:41 04.06.2020

  1. При выборе предпочитаемого языка поиска в списке словарей (как в левом, так и в выпадающем) должны остаться только словари, содержащие данный язык. +
  2. Добавить опцию поиска только по точному совпадению / все слова, содержащие данную комбинацию символов +
  3. Добавить опцию поиска только по леммам / по всему тексту словарей. +
  4. В случае посика по всеме тексту в список найденного помимо лемм выводить только строчки, содержашие искомое слово. +
Удаленка

опубликовал admin в 11:54 02.04.2020

1. Написан bash скрипт копирования аудио файлов в system_audio

Тест

опубликовал Öньö Лав в 10:26 21.03.2020

1999, 1.999 - работает

19796, 19 796, 19.796 - не работает

16 марта

опубликовал admin в 14:02 16.03.2020

1. Установка операционной системы на новый ПК Епимаховой Светлане (бухгалтерия)

2. Замена и настройка проектора в большом зале

3. Установка Малыгину Михаилу КриптоПро, настройка электронной подписи

12 марта

опубликовал admin в 8:49 13.03.2020

1. Техническое обеспечение работы синхронного перевода "Северного культурного форума"

10 марта

опубликовал admin в 7:23 11.03.2020

1. Сборка комплектующих в системный блок, установка операционной системы Епимаховой Светлане.

2. Обновление комплектующих ПК Малыгина Михаила Александровича, миграция операционной системы, перенос данных

3. Доставка комплектующих из ДНС

4. Тестирование оборудования синхронного перевода в госсовете

5. Подготовка техники на списание (2 ноутбука)

3 марта

опубликовал admin в 14:39 03.03.2020

Техническое сопровождение настройки принтера на удаленном рабочем столе в 1С

Работа

опубликовал admin в 11:34 27.02.2020

1. Настройка принтеров каб 54

2. Настройка Acrobat Reader каб 74

3. Подбор оборудования, формирование счетов на оплату

Пятница

опубликовал admin в 10:09 10.02.2020

Переписан webspell.fu-lab.ru

Четверг

опубликовал admin в 10:09 10.02.2020

Техническое обеспечение синхронного перевода круглого стола в ЦКК

Среда

опубликовал admin в 17:37 05.02.2020

1. Техническое сопровождение синхронного перевода в Адм. главы

Яндекс.Метрика