Коллеги, есть изумительный наш писатель, Вонлярлярский, перечитанный не единожды из имеющегося в электронном виде (первые его несколько книг были в печатном виде куплены в 80-х). Не умен этот критик Полевой, не случилось для него заслуженной Маргариты. Но книг Вонлярлярского очень мало в распознанном виде, четверть от написанного. В РНБ есть сканы в пдф из библиотеки одного из великих наших князей, да и я раздобыл пдф сканы.
Задача не тривиальная, это все распознать-перевести в смысле избавления от старой письменности. Кто может подсказать, помочь??
Распознавание pdf с Ъ - c Ять, т.е. с дореформенного
-
YuraRimskiy
- Сообщения: 7
- Зарегистрирован: 02.08.2024
ИИ не справляется?
Кинул Дипсику ваш скрин, нормально распознал:
Кинул Дипсику ваш скрин, нормально распознал:
Cкрытый текст
Не знаю существует ли теперь, но несколько лёт тому назад, в Петербург, существовал домъ Кузьмы Тихоновича Парёенина, человека холостаго, пожлаго и до крайности робкаго.
Съ жильцами своими обращался Парёенинъ робко, и не много смѣліе съ дворникомъ, котораго называлъ по имени и отчеству. Робость произошла въ Кузьмѣ Тихоновичѣ отъ грубаго обхождения съ нимъ товарищей по гимназии, пристававшихъ къ нему, лѣтъ сорокъ назадъ, съ утра до вечера; домъ же съ надворнымъ строениемъ перешелъ къ нему по наслѣдству отъ отца. Просыпаясь каждое утро съ пѣтухами, Парёенинъ не зажигалъ свѣчи, а ожидалъ, съ примернымъ терпѣниемъ, очень поздняго иногда появлянія свѣта; со свѣ
Съ жильцами своими обращался Парёенинъ робко, и не много смѣліе съ дворникомъ, котораго называлъ по имени и отчеству. Робость произошла въ Кузьмѣ Тихоновичѣ отъ грубаго обхождения съ нимъ товарищей по гимназии, пристававшихъ къ нему, лѣтъ сорокъ назадъ, съ утра до вечера; домъ же съ надворнымъ строениемъ перешелъ къ нему по наслѣдству отъ отца. Просыпаясь каждое утро съ пѣтухами, Парёенинъ не зажигалъ свѣчи, а ожидалъ, съ примернымъ терпѣниемъ, очень поздняго иногда появлянія свѣта; со свѣ
-
YuraRimskiy
- Сообщения: 7
- Зарегистрирован: 02.08.2024
Читать научитесь. Вопрос был не про дофигилион страниц, а про распознавание дореволюционного русского языка. Современные нейронки справляются. Дальше уже может быть другой вопрос: как там большой файл разбить на мелкие или тариф оплатить, в котором нет ограничений.zotkindm: прежде чем такие заявления кидать, запили 150 страниц скана и скинь дипсику. потом нам отпишись.
Не надо грубить друг другу. Можете сделать или помочь? - за дело.
Вот пример - https://www.dropbox.com/scl/fi/z5l6mst8 ... D%22all%22
Вот пример - https://www.dropbox.com/scl/fi/z5l6mst8 ... D%22all%22