Технічні питання оцифровування

Нові коментарі

Нова тема   Відповісти
Сторінка:  1, 2, 3, 4, 5, 6  наступна
немає
Автор Повідомлення
ingwar 
Модератор літератури


З нами з: 08.03.08
Востаннє: 22.10.17
Повідомлень: 1235

2011-07-15 08:31  
Створив тему, в якій можна було б обговорити різні технічні питання/ проблеми, пов'язані з оцифруванням книг.

Власне, у мене й перше запитання.

Для створення djvu використовую таку послідовність дій:
1. сканування
2. обробка ScanTailorPlus-0.9.11[32bit]-2012-03-06
3. обробка ST Split v1.3
4. формування djvu за допомогою DJVU Small v0.4

Проблема у тому, що у кінцевому djvu сторінки мають різний розмір, причому суттєво:


Тепер по-порядку:
Є ось таке зображення після сканера (на ньому на одній картинці є дві сторінки (550-551), одна з яких на попередньому малюнку маленька, а інша вже - велика):


Після Scan Tailor є дві картинки:

Ширина цих картинок одинакова: 2858 пікс (та й висота однакова- 4902 пікс). Роздільна здатність також однакова: 600 dpi. Глибина кольору одинакова (зображення чорно-біле). Причому одинакова як у самому ScanTailor, так і при перегляді сторонніми засобами (наприклад, і Провідник Windows, і Corel PHOTOPaint, і ACDSee показують ті ж дані)

Після ST Split фактично ті ж дві картинки (на них у книзі немає малюнків):

Параметри цих зображень також одинакові (ті ж, що і в попередньому випадку).

Але при збиранні djvu виходить так, як показано на першому приведеному малюнку- ці сторінки чомусь сильно відрізняються розміром.

У чому може бути справа і як це можна виправити? Чому DJVU Small одинакові зображення (вірніше, зображення з одинаковими технічними даними, так по-різному обробляє)? Чи я що не так роблю, чи це "фіча" програми?

P.S. Всі описані мною зображення можна відкрити у повний розмір кліком на відповідних картинках (але не знаю, чи сайти, на які вони завантажені, не роблять якоїсь своєї оптимізації, і відповідно, змін). Того завантажив також на файлосховище (там в архіві всі приведені картинки): http://depositfiles.com/files/wmztucucw
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-07-15 12:43  
Я ж в приваті писав щоб додати вихідний djvu файл "djvu encoded".
Без файла з наявною помилкою так нічого не скажеш - спробуйте версію 0.4.4 замість 0.4 і настройками виберіть по замовчуванню.
Всі наведені файли в нормі - при кодуванні в мене все виходить.

Зауваження перше - сканувати краще в tiff, друге - поля збоку та знизу завеликі. Останнє не суттєво але скоріш за все всі сторінки "рівняються" на титульну - з неї потрібно прибрати галочку "Match size with other pages".

Додано через 1 хвилину 27 секунд:

з depositfiles "качав" години зо три
ingwar 
Модератор літератури


З нами з: 08.03.08
Востаннє: 22.10.17
Повідомлень: 1235

2011-07-15 13:54  
Додав djvu encoded.djvu:
http://depositfiles.com/files/gvwfza42a

Налаштування там і були всі за замовчуванням

Додано через 1 хвилину 17 секунд:

ingwar написано:
з depositfiles "качав" години зо три

Там 1.7 Мегабайта. На що там 3 години пішло?

Додано через 1 хвилину 37 секунд:

Цитата:
прибрати галочку "Match size with other pages"

а де ця галочка є?
Smoke 
Свій


З нами з: 14.05.08
Востаннє: 08.07.13
Повідомлень: 144

2011-07-15 14:31  
Ви краще DjVu викладіть. Загалом здається на різних на сторінках різна dpi.
Що конкретно робить ST Split ?
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-07-15 14:36  
Мені не вдалося відтворити даний збій в 0.4.

Ваші дії наступні:
- в ScanTailor на 503 сторінці вручну задаєте корисну зону - етап Selest content - програма зайво включила нижню чорну зону - потрібно лише текст
- етап Margins - можливо треба зменшити поля - на Ваш вибір + прибрати галку "Match size with other pages" з обкладинок
далі виводите наново

- ST Split /Обкладинка має бути методом підклеювання?/ доцільно лише для сірих та кольорових сторінок - тут крім кількох сторінок решта просто займають час при поділі

- DjVuSmall краще взяти 0.4.4 хоча можна спробувати і 0.4 - профіль "Agressive (600 dpi)"

На мому ip багато народу і на депозит "черга".

Додано через 4 хвилини 48 секунд:

Smoke написано:
ST Split

творить майже те саме що ST Separator - розділяє файли на пару: чорно-біле та інше.
ingwar 
Модератор літератури


З нами з: 08.03.08
Востаннє: 22.10.17
Повідомлень: 1235

2011-07-15 15:29  
так, з відступами свою помилку зрозумів, вияснив у чому діло.

Smoke написано:
Ви краще DjVu викладіть. Загалом здається на різних на сторінках різна dpi.

я його виставив у другому свєму пості у цій темі
golem написано:
- ST Split /Обкладинка має бути методом підклеювання?/ доцільно лише для сірих та кольорових сторінок - тут крім кількох сторінок решта просто займають час при поділі

тут є всього 3 сторінки з сірим/кольоровим. тобто ви кажете взагалі split не використовувати?

golem написано:
- DjVuSmall краще взяти 0.4.4 хоча можна спробувати і 0.4 - профіль "Agressive (600 dpi)"

спробую, про результат відпишу

Додано через 15 хвилин 16 секунд:

от, подивився в самому WinDjView "інформацію про сторінку" для тих двох проблемних сторінок. для меншої стоїть "правильна" роздільна здатність 600, а для тої із завеликим розміром вже чомусь стоїть 72 dpi.

DjvuSmall чогось так зробив...
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-07-15 17:01  
ingwar написано:
взагалі split не використовувати

покищо як зручніше так і робити - головне результат, потім можна поексперементувати і підібрати собі найкращий

ingwar написано:
golem написано:
DjVuSmall краще взяти 0.4.4 хоча можна спробувати і 0.4 - профіль "Agressive (600 dpi)"

якщо чесно то можна і не перекодовувати - є така утиліта djvutoy і в ній функція вирівнювання dpi по всіх сторінках. Але вже дуже мені не подобались ті заширокі нижні поля :)

ingwar написано:
DjvuSmall чогось так зробив...

72 dpi - це стандартне "розширення" монітора. DjvuSmall правильно визначив dpi на 550 сторінках а на 10 остнаніх вирішив відпочити - і таке буває - головне помітити та виправити
ingwar 
Модератор літератури


З нами з: 08.03.08
Востаннє: 22.10.17
Повідомлень: 1235

2011-07-15 18:24  
А що значить профіль "Agressive (600 dpi)"? Примусове встановлення dpi?

Додано через 1 годину 20 секунд:

От халепа Happy

При новішому DjVuSmall, при різних налаштуваннях одне і те ж. При тому, що в ScanTailor я перегенерува всі сторінки, щоб зменшити поля. Фактично все з нуля зробив. І далі на тих сторінках скачак у розмірі.

При цьому, якщо Djvu формувати тільки на основі цих двох файлів, все ОК, сторінки обидві однакові. А якщо всі картинки брати- сторінки розміром виходять різні.
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-07-15 19:06  
ingwar написано:
А що значить профіль "Agressive (600 dpi)"

що скан кодується на передній шар таки з примусовим 600 dpi і поверхово дивиться на подібність символів /при поганому друці путаються "и" та "н" і т.п./

ingwar написано:
при різних налаштуваннях одне і те ж

так і має бути User=Agressive + скани вже в 600 dpi - принципово має вийти такий самий чорно-білий djvu з 600 dpi

ingwar написано:
А якщо всі картинки брати- сторінки розміром виходять різні.

все поправимо:
1. папку з сирими сканами та папку out /по замовчуванню вона в папці з сканами/ і зі всім вмістом: папками ST Split "1" та "2" виставляєм торентом на "Сирий матеріал" - що треба я скачаю /небагато буде/.
Малоймовірно що це баг але як так то в мене є бажання його найти.

2. як треба вирівняти dpi - качаєм програму DjVuToy, закладка DPI & Width, "Fixed DPI fo every page" -> "600" -> "Go"
або я закачаю, закодую та поправлю і вишлю /займе десь хвилин 20 - появиться торрент напишіть в ПП/
ingwar 
Модератор літератури


З нами з: 08.03.08
Востаннє: 22.10.17
Повідомлень: 1235

2011-07-15 22:09  
Методом "наукового вгадування" вияснив таке: якщо забрати титулку (перший кольоровий файл), то все генериться добре. Хоча та титулка мала той же розмір і ту ж роздільну здатність.

Можливо, причина крилась у тому, що ту титулку я в СканТейлорі не обробляв, а потім просто вставив відповідний файл у вихідну папку СканТейлора, і вже тоді генерував djvu-файл. Тепер я додав ту титулку до проекту СканТейлора, СканТейлор створив сам відповідний файлик з картинкою (правда, той файлик я таки підрізав і змасштабував наново ззовні за допомогою ACDSee). І тоді DjVuSmall згенерував все добре.

Правда, для мене загадкою залишилося, чому перший файл титулки раптом вплинув на вигляд сторінки 551 і далі Happy

Додано через 1 хвилину 18 секунд:

Тепер ще запитання по накладанню текстового шару на готовий djvu. В мене FineReader 10, і він несумісний з DjVuOCR. Є якийсь іншийй шлях?
ingwar 
Модератор літератури


З нами з: 08.03.08
Востаннє: 22.10.17
Повідомлень: 1235

2011-07-17 10:31  
На питання про текстовий шар у ПП відповів golem:
Цитата:
Варіант 1 - скачати та поставити портатабл версію - https://toloka.to/t4840
Варіант 2 - більш машинозагружений та часоємкий - скористатись ФР 10 - сторити ПДФ - Перегнати ПДФ у ДЖВЮ програмою pdf2djvu - витягнути ocr шар з даного "паршивого ДЖВЮ" - вставити згаданий шар у "нормальний" ДЖВЮ


За першим варіантом справді все вийшло.
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-07-31 23:36  
Перефотографував книгу-хрестоматію японської класичної поезії. Сам процес фотографування виглядає приблизно так: фотик на штативі, максимально зручно спрямований на текст, фотографую по 1 сторінці. Оскільки книга доволі об'ємна, при фотографуванні із перегортанням сторінок розмір останніх на фотографіях стрибкоподібно зменшується (підкладаю книги).

Після завантаження у скантейлор почався справжній "тихий жах" - "корисні зони" із віршами розпізнає ПРАВИЛЬНО, тобто, на біду, зліва і справа програма немилосердно "ріже" сторінки. Із вбудованою опцією обрізки у ФР 10 (де зберігаються виставлені за першим разом пропорції обрізки) теж не все гладко, оскільки, як вже зауважив, при фотографуванні із перегортанням сторінок розмір останніх на фотографіях стрибкоподібно зменшується. Таким чином, утворюється замкнуте коло. Як за таких умов вирівняти розміри сторінок? Прошу поради...
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-02 21:27  
Для того щоб не товкти головою об стінку не підкладати книги, журнали і т.п. макулатуру можна спробувати:
1. фотоапарат на штатив - об'єктив вгору - зверху міцне добре закріплене скло - на склі як на сканері "гортається" книга
2. така конструкція
3. купити сканер /позичити, "вкрасти", "подарувати" собі, жінці/коханій і т.д. і т.п./ - навіть в Тернополі на онлайн-об'явах пропонують сканери по 100-200 грн/б.у.

cizarion написано:
на біду, зліва і справа програма немилосердно "ріже" сторінки

все правильно - там немає цінної інформації, якщо не враховувати відбитки пальців власника.
Після "Selest Content", - де лишнє обрізається, є етап "Margins" де можна і в даному випадку необхідно вирівняти всі сторінки до одного розміру та відцентрувати /або згрупувати зліва чи справа/ корисний вміст на всіх сторінки /чи групі сторінок/
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-08-02 23:07  
golem написано:

Для того щоб не товкти головою об стінку не підкладати книги, журнали і т.п. макулатуру можна спробувати:
1. фотоапарат на штатив - об'єктив вгору - зверху міцне добре закріплене скло - на склі як на сканері "гортається" книга
2. така конструкція

час, час, час...
тоді йде МОООРЕ часу на фотографування (за теперішніх умов, наприклад, на 100 сторінок у мене йде близько 10 хвилин)

golem написано:
3. купити сканер /позичити, "вкрасти", "подарувати" собі, жінці/коханій

та є в нас сканер, старий мустек1200, але повільний, як холєра, "взнь... взинь... вззззззззззззззззин... чх-чх... пть-пть-пть-пть-пть-пть...взнь-взнь"Happy

Цитата:
є етап "Margins" де можна і в даному випадку необхідно вирівняти всі сторінки до одного розміру та відцентрувати /або згрупувати зліва чи справа/ корисний вміст на всіх сторінки /чи групі сторінок/

зазвичай тоді залишаються широченні поля знизу та по бокахSad (1)
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-03 12:04  
cizarion написано:
тоді йде МОООРЕ часу на фотографування

а так океан часу на сканобробку

cizarion написано:
зазвичай тоді залишаються широченні поля знизу та по боках

якщо на більшості сторінок таке - значить вирівнювати по розміру треба не всі сторінки /найчастіше забувають знімати галку "Match size with other pages" для титулок, форзаців, вклеєних іллюстрацій/
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-08-05 21:26  
golem написано:
а так океан часу на сканобробку
та де там Happy взагалі, під час обробки книги найбільше мого часу забирає хіба що скантейлор (після завантаження в нього фото запускаю його одразу на етапі визначення корисних зон, а потім правлю за потреби на попередніх етапах). загалом всі процедури "виносять" десь по 20 хв. на 100 "важких" сторінок.
може, для когось це й дуже багато... не знаю

golem написано:
якщо на більшості сторінок таке - значить вирівнювати по розміру треба не всі сторінки /найчастіше забувають знімати галку "Match size with other pages" для титулок, форзаців, вклеєних іллюстрацій
та проблеми це все одно не вирішує. доводиться вгадувтаи із розмірами бокових полів на сторінках із віршами, а потім вирівнювати розміри сторінок в букресторері. якщо без віршів - виходить ніби нічого такHappy
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-05 22:13  
Я ще розумію коли ST використовують після BR-а, але ніяк не навпаки, тим більш для вирівнювання розмірів. Тут щось не те, але на пальцях нічого стверджувати не буду - потрібні наочні приклади кількох сканів, без них в цій темі можна лиш флудити.
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-08-06 14:19  
гаразд, наочні приклади.
підбираю навмисно досить непрості випадки
1. "сирі" фото (для зручності обзервування повернуті на 90 градусів та через поганеньку швидкість мого інтернету стиснуті до 1024х768):

2. ці самі фото після обробки ST (вивід тільки у сірому, а не в Ч/Б; виходять зображення по 9-15 Мб кожне, тому знову стискаю до 1024х768, сподіваюсь це не заважає наочній оцінці процесів):

3. ці самі фото після вирівняння рядків та розмірів у BR:

4. ці самі фото після DJVU Solo:
висновок: наскільки я зрозумів, BR легше працювати із зображеннями, обробленими в ST, ніж у зворотньому порядку.
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-06 15:33  
Я вважав що непрості випадки це з віршами, де не важко вирівнювати сторінки. Якщо користуватись ST лиш для "обрізки" рекомендую ознайомитись з ST Skipper - дозволяє пропускати етапи.
Коли є лише текст бажано кодувати у монохромному режимі - ті сірі полоси зайві. Щоб такі тіні не появлялись і є лиш фотоапарат використовують притискне скло.
muestro 
Відео Гуртом - фільмокрай
Відео Гуртом - фільмокрай


З нами з: 28.10.09
Востаннє: 21.10.17
Повідомлень: 864

2011-08-08 10:09  
з радістю б допоміг - є трохи літератури - робив би сирий матеріал.
маю фотик ось такий -
розеткаюа
http://rozetka.com.ua/ru/products/details/39900/index.html
штатива немає і не буде. в якому режимі фоткати я не знаю

десь за місяць-півтора ще куплю ось це щастя
http://deshevshe.net.ua/multifunctiondevice-canon/canon_pixma_mp495_wifi.html
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-08 10:54  
DVO
Ліпше почекайте місяць - потім порівнюючи скани фотоапаратом зі сканером будете жалкувати. Заодно і список наявної літератури буде час скласти - щоб можна було робити по заявках та скани на диску пилюкою не припадали.
Щодо сканера то там CIS матриця - глибина мала - треба буде добре прижимати книгу, а так підходить.
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-08-08 23:26  
DVO написано:
штатива немає і не буде. в якому режимі фоткати я не знаю
штатив - половина успіху, без нього дуже важко... чомусь ваше посилання не відкривається, тому не можу визначити модель фотика...
"методом викрутки" для свого Samsumg ST60 виявив, що найкраще підходять:
режим: антивуалент;
ISO: авто
розмір: 8-12 Мп
якість: супер
EV: - 0.3
баланс білого: авто
зона фокусування: мульти
експозамір: мульти
автоматичне балансування контрасту: вимкн.
DIS: off

golem написано:
порівнюючи скани фотоапаратом зі сканером будете жалкувати
напевно, це ваша суб'єктивна думка. попри ряд проблем, я зовсім не шкодую, що оцифровую фотоапаратомHappy

Додано через 5 хвилин 16 секунд:

потрібен швидкий лікнеп зі створення fb2.
що порадите?
Ooops 
Частий відвідувач


З нами з: 14.08.10
Востаннє: 16.10.17
Повідомлень: 33

2011-08-09 08:41  
Цитата:
потрібен швидкий лікнеп зі створення fb2.


Схоже, таке: http://lib.rus.ec/node/109781
А ось ця книга вважається найбільш толковим курсом: http://lib.rus.ec/b/156888/read
Успіху!
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-09 10:46  
cizarion написано:
напевно, це ваша суб'єктивна думка

це факт - для початківця або просто особи, що вирішила пересканувати декілька книг, на сканері набагото простіше отримати задовільний результат ніж за допомогою фотоапарата.
Фотоапаратом швидше працювати лише при наявності "спецстанка" - сюди входить налаштоване освітлення, автоматизація спуску та передачі даних на ПК, притискне скло і т.д. - досить дорогий варіант.

А я шкодую, що у вас нема сканера :)

Ooops
Книгою за другим посиланням початківцю варто і обмежитись - майже все і ніяких суперечностей.
За першим посиланням йде обговорення тонкощів людьми які зробили по сотні і більше книг - людині новій вникнути буде важко.
FBE я б радив брати з Чтиво->Довідка->FictionBook Editor - в мене на відміну від інших принаймі не глючив та й українізований.
lpershyi 
Попереджень: 2
Попереджень: 2 


З нами з: 04.01.11
Востаннє: 03.08.17
Повідомлень: 2742

2011-08-09 15:32  
golem написано:
навіть в Тернополі
а мені приходиться зараз фоткати бо сканер ніяка програмка, чи оф. дрйвери не приймають Віндовс сімку Sad (1)
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-08-09 23:00  
golem написано:
А я шкодую, що у вас нема сканера Happy

Happy
Цитата:
та є в нас сканер, старий мустек1200, але повільний, як холєра, "взнь... взинь... вззззззззззззззззин... чх-чх... пть-пть-пть-пть-пть-пть...взнь-взнь"
сканував ним колись книги, але ті часи згадую, як середньовіччя, "темні віки", обкладинки виходили малоякісні, на розворотах книг постійно "з'їдало" цілі смуги тексту, засинав, поки переставляв книгу, матюкався на ФР, на малюнки, всі у смугах від повзунка...
а книги великого формату?Sad (1)

golem написано:
Фотоапаратом швидше працювати лише при наявності "спецстанка"
у середньому фотографую 100 сторінок за 10 хв.
90% часу обробки виконує ноут, у мене ж забирає близько 20 хв. на 100 сторінок.
не знаю, чи із сканером у мене був би такий результат. може, й був би, але фотик мені чудово підходить. ввімкнув якийсь фільм на телефоні, налаштував штатив, дивлюся і цоркаю, цоркаю і дивлюся, поєдную приємне із кориснимHappy
знайшов місце, де більш-менш рівномірне освітлення. всі налаштування, весь процес обробки максимально оптимізований)

Oooops, golem,
дякую за посилання та порадиHappy
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-10 09:44  
Характеристики сканера Mustek 1200: час лише на повернення каретки назад - 23 секунди!; живлення від usb-порта; один з перших-гірших варіантів СІS матриці "тобто що не прижав - то і не побачиш". Це була бюджетна модель ще років з десять назад - одним словом на сьогодні це виняток.

Книги де одна сторінка більш ніж формат А4 - це окрема пісня і однозначно не для фотоапаратів на 10-15 МП.

Сканер: 100 сторінок -> 50-52 розворота -> 13 хвилин. І ніяких скидувань на комп, ніяких JPEG.
Обробка на такому рівні на 100 сторінок і 5 хвилин не займе.

"... всі налаштування, весь процес обробки максимально оптимізований ..." - я іншої думки:
- відсутнє прижимне скло - відповідно сірі полоси на сторінках
- фото в форматі jpeg - більш розмиті букви
- програма Solo - давня, менше налаштувань, менш продуктивна - краще Document Express Editor від LizardTech або DjVu Small
- режим стиснення для тексту scanned зайвий - bitonal по бінаризованих сканах дає більш читабельний та менший по розміру djvu-файл
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 22.10.17
Повідомлень: 2036

2011-08-11 00:39  
golem написано:
- відсутнє прижимне скло - відповідно сірі полоси на сторінках
у книгах старих, із покрученими від часу сторінками
скло мені використовувати просто нераціонально (хоч і маю) - забирає у 2-3 рази більше часу
golem написано:
фото в форматі jpeg - більш розмиті букви
що зроблю, якщо у мене такий фотоапарат(?!)
golem написано:
програма Solo - давня, менше налаштувань, менш продуктивна - краще Document Express Editor від LizardTech або DjVu Small

тільки давайте облишимо Смол у спокої. користуюся також і нею, але надаю перевагу соло, оскільки там можна проводити постобробку, та й за результатами моїх власних експериментів на однаковому вихідному матеріалі за однакових налаштувань Смол доволі часто давала ГІРШИЙ (sic) результат, ніж стара Соло
golem написано:
режим стиснення для тексту scanned зайвий - bitonal по бінаризованих сканах дає більш читабельний та менший по розміру djvu-файл
при згаданій бінаризації активно "пожираються" елементи літер на тих частинах сторінки, які найбільше освітлені, у той час, як все залишається на місцях при режимі "скан". до того ж, при останньому у ФР ступінь розпізнавання знайно більший, ніж при бітоні (знову ж, мої власні експерименти на моїх власних творіннях) десь так 99.5% проти 95-96%

golem написано:
Характеристики сканера Mustek 1200: час лише на повернення каретки назад - 23 секунди!; живлення від usb-порта; один з перших-гірших варіантів СІS матриці "тобто що не прижав - то і не побачиш". Це була бюджетна модель ще років з десять назад - одним словом на сьогодні це виняток.
...стільки нових, цікавих слів,)
та я сам, в принципі, виняток, взявся за оцифрування книг із допотопним сканером та дешевим фотиком, не знаходите?-)
golem написано:
Книги де одна сторінка більш ніж формат А4 - це окрема пісня і однозначно не для фотоапаратів на 10-15 МП.
найкращий варіант, звісно, хороша дзеркалка, якщо на те пішло, + станція десь так на 10-15 Гб оперативи із іСоre 7 по 3.3 ГігаГц для обробки книг, але власне матеріальне становище можу трактувати тільки як трохи вище за мінімальний рівень. так, техніка просунулася із того часу, відколи 6 років тому купив свій нещасний Мустек, і 3/4 року, відколи купив свій не кращий Самсунг СТ60, модний кілька років тому (якщо не більше).
зрозумійте: ви АБСОЛЮТНО праві, моє технічне забезпечення - ЗАСТАРІЛЕ, НОВЕ я за свої 1.5 тисячі зарплати + видатки на сім'ю, через які мушу ще й підробляти, просто не в змозі купити, хоч і марю уві сні про дзеркалкуHappy
так, я АМАТОР, а не професіонал, може, значною мірою, через вище розтлумачені причини.
факт залишається фактом: оцифрував уже не одну сотню книг, і з кожною новою рівень трохи, та й зростає. за даних умов "витискаю" і "витискатиму" максимум із доступних мені техніки та ПЗ. credo:)
golem 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 24.04.09
Востаннє: 19.07.17
Повідомлень: 347

2011-08-11 14:51  
cizarion я не ставлю за ціль переконати вас робити так як на мене правильно - заставляти чи вмовляти когось щось робити на мій погляд безглуздо - результат якщо й буде то негативний.

Але це форум і цілком вірогідно що хтось подивиться "Є людина що оцифровує багато книг майже таким самим фотоапаратом як в мене - це певно просто - а ну ж бо і я збацаю одну книжку" і появляється АкЕ і шириться ентропія мережею і щастя коли лиш одна книжка і горе коли бажання штампувати є а вдосконалюватись ні і добре хоч прочитати можна, а то ...

Досить лірики :) - приклад /непоодинокий/: взяв книгу в бібліотеці, добра книга, думаю оцифрую, глянь в мережі є, значить повертаю в бібліотеку, через рік треба глянути а те що в неті прочитає лише криптоаналітик а бібліотека то у Львові.

Оцифровані вами книги читаються /при відсутності серйозних вад зору/, комусь потрібні, відповідно всі щасливі.

Технічні зауваження:
- покручені сторінки - скло дещо вирівнює а двохстороннє освітлення майже забирає тіні
- фотоапарат /принаймі мій/ можна неофіційною програмкою заставити зберігати фото в сирому вигляді
- Solo кращий результат ніж DEE LT або Small - не вірю, скоріш були невідповідні налаштування
- нерівномірно освітлені сторінки - на сканері таке майже не зустрічається, а на фото потрібно "виставляти" світло

P.S. бажаю вам до сканера і дзеркалку /в мене не має і не буде ні першого ні другого/
DukeNukem 
VIP


З нами з: 15.01.09
Востаннє: 22.10.17
Повідомлень: 432

2011-08-12 17:11  
Яке розмиття краще використовувати для дерастиризації?
Ваш часовий пояс: GMT + 2 Години

Нова тема   Відповісти Сторінка:  1, 2, 3, 4, 5, 6  наступна