Технічні питання оцифровування

Нові коментарі

Нова тема   Відповісти
Сторінка:   попередня  1, 2, 3, 4, 5, 6  наступна
Автор Повідомлення
balik2 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 19.01.11
Востаннє: 10.12.18
Повідомлень: 1351

2012-04-06 20:25  
Bookinist_ua написано:

1. А можна для кожної сторінки окремий режим обрати?

2. А якщо на багатьох сторінках є і фото і текст.

використовуйте скантейлор і там де є зображення вибирайте режим Змішаний на останньому етапі

після чого в подальшому зможете текст кодувати в ч/б профілі, а зображення в профілі Фото, а потім поєднати їх в один файл
agent-maska 
Поважний учасник


З нами з: 17.12.08
Востаннє: 09.12.18
Повідомлень: 188

2012-07-02 10:13  
Доброго дня) Я переглянув тему( може пропустив) а в який формат сканувати сканером варто???

або якою програмою краще сканувати замість стандартної?
lasmen 
VIP


З нами з: 08.12.11
Востаннє: 11.08.13
Повідомлень: 619

2012-07-02 11:07  
Стандартний найкращий, але можна сканувати fine reader. це програма для розпізнавання тексту, нею також можна сканувати.
Мабуть, найякіснішу це .bmp але вони багато місця займають, досить чудові розширення це .png i .jpg (.jpeg)
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2012-07-02 11:30  
agent-maska написано:

Доброго дня) Я переглянув тему( може пропустив) а в який формат сканувати сканером варто???

або якою програмою краще сканувати замість стандартної?

https://toloka.to/t33839 добрий читач(fine reader) 11(поки що), програма яка має десятки параметрів, сканування та обробки відсканованого матеріалу, розпізнає текст та склеює його в єдиний файл, недоліком є те що потрібно кожного разу виставляти параметри збереження, інші параметри програма пам`ятає, швидкість обробки зображення залежить від швидкості комп`ютера, а сканування від швидкості комп`ютера та сканера.
balik2 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 19.01.11
Востаннє: 10.12.18
Повідомлень: 1351

2012-07-02 11:40  
taras1994 написано:
недоліком є те що потрібно кожного разу виставляти параметри збереження

що мається на увазі?
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2012-07-02 12:15  
balik2 написано:
що мається на увазі?

виставляти високу якість зображення, наявність або відсутність текстового шару, наявність зображень, для різних типів файлів.
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2012-07-21 12:18  
Прочитав цю тему повністю, і зрозумів, що я вмію лише сканувати, і не дуже якісно створювати djvu.
Проте більш цікаво було б почути про технічну сторону. Отже розкажу про свій досвід.

Звісно сканувати можна будь яким комп`ютером, і це факт, проте тоді складається погане враження, що "чим швидший комп`ютер тим швидше скануєш", але це не так. Існують певні обмеження.
1. Сканер, так саме сканер першим створює зображення, і від того наскільки він швидкий, буде визначатися швидкість сканування, тобто швидший комп`ютер не буде швидше сканувати, якщо сканер повільний.
2. Комп`ютер, це пристрій який отримує зображення, він може лише сповільнити роботу сканера, а от пришвидшити її він не в змозі.
3. Програма, так, так саме програма визначає швидкість обробки, вона не здатна працювати швидше своєї здатності, це так само, як перегляд фільму HD слабкий комп`ютер може повільно грати фільм, в той час як швидкий не буде грати той самий фільм швидше ніж цей фільм було зроблено.

Висновок. не потрібно тішитися марними ілюзіями, про i7 на шести ядрах, який нібито є ідеальним верстатом. Отже розглянемо конфігурацію яка буде сканувати нормально:
1. Материнська плата, люба сама дешева s1155 сокет
2. Процесор, Intel Core i5-2300 2800MHz/L3-6144Kb/DMI s1155 box, чотири ядра з такою частотою, ніколи, ще раз повторюю, ніколи не будуть використовуватися програмами для сканування на повну потужність, тобто ви зможете одночасно дивитися фільм в HD якості і використовувати всі програми для сканування, відеокарта не потрібна тому, що вбудована Intel HD 2000 для звичайного користувача підходить.
3. Оперативна пам`ять, Kingston DDR3 4096Mb PC3-10600 1333MHz (KVR1333D3N9/4G), для прикладу, тобто самої дешевої на 4 гб буде достатньо, але якщо маєте зайві 200 грн то купляйте 8гб, під час сканування, та обробки вони можуть вберегти вас від сюрпризів, (не так страшно коли процесор працює на 100%, все зупиняється якщо оперативної пам`яті не вистачає.)
4. Жорткий диск, купляєте самий дешевий ssd на 32 гб, для настільного комп`ютера, і зовнішній жорсткий диск на 3тб,
5. Монітор, бажано два, один менший інщий більший, TN або Ips вирішуйте самі, я за TN, бо Ips дорожчий
6. Операційна система, Ставите дві операційні системи, безплатний лінукс, це якщо запитає покуратура, і віндовс для сканування.

PS, сканувати можна будь яким комп`ютером і сканером\фотоапаратом, я навів оптимальну конфігурацію на літо 2012.
Форкуш 
VIP


З нами з: 03.02.10
Востаннє: 10.12.18
Повідомлень: 2256

2012-09-13 13:00  
Маю проблему.
ВИрівняні за розміром сторінки в Scan Tailor переіменувалися в
1
1_1
1_2 і т.д. аж до 1_82
Та коли я знову ці ж самі сторінки вкладаю у Scan Tailor, щоб знову підкорегувати, він чомусь сортує так
1
1_10
1_11
1_12
1_13
1_14
1_15
1_16
1_17
1_18
1_19
1_2

Те саме ф Файн Рідер 10 робить...

Підкажіть як вирішити проблему!!!
cizarion 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 01.01.10
Востаннє: 09.12.18
Повідомлень: 2035

2012-12-06 18:15  
taras1994, дуже цікаві дані. дякую, трохи просвітився)
єдине викликає сумнів:
taras1994 написано:
сканувати можна будь яким комп`ютером і сканером\фотоапаратом
але то таке...

питання "на засипку":
на Він8 ентерпрайз
djvu small 4 при запуску процесу конвертування починає стрімко жерти оперативку, поки не з'їдає всю, за 5 хв із величезним напруженням конвертує 4 сторінки (на іншому компі 0) та вибиває помилку (щось типу process failed. any page hasn't been converted). у лозі щось на зразок cann't find byte stream.

чим це може бути викликано? хтось із таким стикався?

п.с. на Він8 РП білд 8400 такого не було, все відбувалося гладко

Додано через 2 хвилини 28 секунд:

Форкуш написано:
Маю проблему.
перейменуйте файли у тотал коммандері та й по всьому)
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2012-12-06 23:26  
Форкуш
вам потрібно всі сторінки додати у файн рідер а потім зберегти їх як зображення, тоді порядок буде виставлего самим файн рідером.

а нумерувпти потрібно десь приблизно так
1_01
1_02

це якщо за логікою і правильним порядком

Додано через 2 хвилини 56 секунд:

cizarion
так вісьмірка гарна але досвіду сканування на вісьмірці я не маю. Вважаю що для сканування найкращим варіантом є сімірка.
Smoke 
Свій


З нами з: 14.05.08
Востаннє: 08.07.13
Повідомлень: 144

2013-01-04 12:43  
agent-maska написано:

Стандартний найкращий, але можна сканувати fine reader. це програма для розпізнавання тексту, нею також можна сканувати.
Мабуть, найякіснішу це .bmp але вони багато місця займають, досить чудові розширення це .png i .jpg (.jpeg)


А ви якісно хочете робити чи як-небудь, щоб совість спокійно собі спала?

Якщо якісно:
Програма: VueScan
Формат: Нестисненний tiff

Якщо для імітації діяльності - дивіться повідомлення lasmen.

PS: Якщо ви збираєтесь робити djvu. НІКОЛИ НЕ СКАНУЙТЕ ФАЙНОЧИТАЧЕМ (FineReader), І НІКОЛИ НЕ ЗБЕРІГАЙТЕ У "добрий формат/розширення" jpeg. Якщо ж ви це робите знайте на перед: результат виросте у декілька (десятків) разів по мегабайтам і читати його буде м"яко кажучи не так комфортно.
balik2 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 19.01.11
Востаннє: 10.12.18
Повідомлень: 1351

2013-01-04 14:01  
Smoke написано:
НІКОЛИ НЕ СКАНУЙТЕ ФАЙНОЧИТАЧЕМ (FineReader),

якщо не виключити обробку зображень то дійсно так, але якщо просто сканити різниці не помітив між скануванням в файнрідер та іншими прогами, зате зручність значно зростає бо весь проект в одному місці і легко контролювати щоб не пропустити який розворот
Smoke 
Свій


З нами з: 14.05.08
Востаннє: 08.07.13
Повідомлень: 144

2013-01-06 12:15  
balik2 написано:
якщо не виключити обробку зображень то дійсно так, але якщо просто сканити різниці не помітив між скануванням в файнрідер та іншими прогами, зате зручність значно зростає бо весь проект в одному місці і легко контролювати щоб не пропустити який розворот


Я не зрозумів складність, чесно кажучи. Скануєте в одну течку, потім просто груповим перейменуванням перейменовуєте усі файли так щоб їх імена співпадали з номерами сторінок - відразу стає видно де і яка сама сторінка пропущена.

Я просто бачу роздачі сирців у вигляді пакетів ФайноЧитача/купи чпегів і відразу робиться погано від думки що їх треба конвертувати у DjVu.
balik2 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 19.01.11
Востаннє: 10.12.18
Повідомлень: 1351

2013-01-06 13:24  
Smoke написано:
Я не зрозумів складність, чесно кажучи. Скануєте в одну течку, потім просто груповим перейменуванням перейменовуєте усі файли так щоб їх імена співпадали з номерами сторінок - відразу стає видно де і яка сама сторінка пропущена.

це в ідеальному випадку, коли є вставки а в наукових книгах вони є завжди такий спосіб не вийде щоб номери сторінки відповідали номеру файлу, бо дуже часто вставки йдуть без номера

в будь-якому випадку є купа зображень з яких тре зробити DjVu Happy
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2013-01-06 14:21  
Я помітив дуже хорошу особливість Ubuntu Precise Pangolin 12.04 LTS amd64 та програми Xsane яку я завантажив з центру програмного забезпечення убунту. А особливість полягає в меншій витраті ресурсів процесора та оперативної пам’яті під час сканування. Отже був у мене нетбук(одноядерний фізично але віртуально двохядерний процесор n455, 2гб озп) на якому була встановлена операційна система вікно 7 та програма файночитача 11, і в такій конфігурації сканер зупинявся 6 разів під час сканування з параметрами 300\сірий\TIFF. Я встановив Ubuntu Precise Pangolin 12.04 LTS amd64 та програму Xsane на цей самий нетбук і ....... о диво можна сканувати без жодної паузи, це вразило мене до глибини душі.

Висновок, якщо ви хочете комфортно сканувати малопотужним комп’ютером, вам потрібно встановити Ubuntu Precise Pangolin 12.04 LTS amd64 та програму Xsane.
Smoke 
Свій


З нами з: 14.05.08
Востаннє: 08.07.13
Повідомлень: 144

2013-01-06 14:36  
taras1994 написано:
Висновок, якщо ви хочете комфортно сканувати малопотужним комп’ютером, вам потрібно встановити Ubuntu Precise Pangolin 12.04 LTS amd64 та програму Xsane.


http://www.liveinternet.ru/users/cm0k/post101407681
Це якщо хочете комфортно сканувати на будь чому (ну... певні межі, все ж є Happy ) до чого можна приліпити сканер. Консольна програмця, не потребує навіть графічного інтерфейсу. Може бути встановлена та налаштована практично в будь-якому дистрибутиві.

Ні пам'яті ні процесора майже не їсть оскільки не має шкідливих звичок сучасних програм: зберігати відскановане в оперативній пам'яті та намагатись якось покращити скан непотрібними для наших завдань фільтрами. По факту тут 486 або Пентіума 1 з головою вистачає щоб сканувати. Інше питання на таких машинах рідко буває достатньо жорсткого диска.
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2013-01-06 15:29  
Smoke
Все ж таки мінімалістичний графічний інтерфейс потрібен. Я перевірив максимальні параметри мого сканера, і нетбук повністю навантажується(процесор -100%) але сканер не зупиняє для "відпочинку", 600dpi\колір\TIFF це для обкладинок. Тепер верстат використовуватиму лише для перегляду hd фільмів, хоча спочатку він складався для комфортної роботи з файночитачем 11.
Smoke 
Свій


З нами з: 14.05.08
Востаннє: 08.07.13
Повідомлень: 144

2013-01-06 18:25  
taras1994 написано:
Все ж таки мінімалістичний графічний інтерфейс потрібен.

Це кому як, я цілком без нього понад рік обходився Happy
Просто лінійкою розміри книжки поміряв і передав у командний рядок. А різного роду висвітлювання і т.д. і т.п. - це вже в обробці.
maxus_bender 
Свій


З нами з: 17.09.10
Востаннє: 06.12.18
Повідомлень: 52

2013-01-13 01:05  
jinotot
Цитата:
Маю невеличку проблему зі сканером

Не можу бути впевнений на сто відсотків, але маю такі думки з приводу вашої проблеми:
1. Зупинки каретки спровоковані паузами в обробці вже відсканованих частин зображення:
а) можливо, якась внутрішня обробка сканером, змінити не можна;
б) передача даних в комп"ютер (швидше за все, ЮСБ інтерфейс, якщо повільніший від 2.0 то затримки будуть стовідсотково), можна перевірити, і по можливості, виправити швидкість;
в) обробка вже отриманої частини даних комп"ютером, деталей не знаю, але очевидно, що тут може вплинути швидкодія старенького процесора.
2. З технічних причин після зупинки в процесі сканування каретка повертається трохи назад, що в результаті видно на зображенні:
а) перешкоди руху каретки, зокрема, занадто сильно притиснутий оригінал, що деформує скло і утруднює рух каретки(робить його нерівномірним), або запиленість/зношеність механізму сканера, можливо, варто розібрати, почистити, змастити;
б) зношеність механізму, зокрема зубчатих передач (вони зазвичай пластикові і не дуже довговічні) спричиняє неточність позиціонування каретки при зупинках, і як наслідок - лишню/відсутню частину інформації, що спричиняє артефакти на вихідних зображеннях. Найкраще - купити/позичити/знайти новий сканер, інакше - ремонтувати стамескою, клеєм і матом, підбирати шестерні від таких же сканерів, які зазнали гіршої долі й померли молодими або на крайній випадок - позичити чарівну паличку у Гаррі Поттера.
jinotot 
Почесний оцифрувальник літератури


З нами з: 28.01.09
Востаннє: 19.10.18
Повідомлень: 3234

2013-03-14 23:30  
maxus_bender написано:
запиленість/зношеність механізму сканера, можливо, варто розібрати, почистити, змастити;
Допомогло з третього разу Happy Розбирав і змащував і до того, як ви написали, втім, як виявилось -- не все і недостатньо. Тож, цього разу звернув увагу на шестерні, а ще, як виявилось, варто було змастити ті місця, де по боках каретка торкається скла. Останнє допомогло позбавитись від неймовірного скреготання, до якого, до речі, я вже майже звик. А тепер от якісь неймовірні відчуття від того, що воно не скрипить і не спотворює рядків. Словом, радості моїй немає меж Happy
maxus_bender, красно дякую за пораду!
vakol 
Свій


З нами з: 17.03.11
Востаннє: 04.12.18
Повідомлень: 77

2013-03-27 12:10  
Мої вітання!
Відсканував 5 том (Ч. 1) "Історії української літератури" М.Грушевського програмою VueScan
у форматі "Нестисненний tiff" (книжка займає більше 7 ГБ), однак через жовтувате тло сторінок не можна якісно перевести програмками "Скантейлор" чи "Букрестор" текст у чорнобілий формат, а якщо виводити як сірі зображення, то місцями залишається сірувато-жовтуватий фон. Що можете порадити в цій ситуації, або, ймовірно, хтось візьме на опрацювання цю "Історію..."?
jinotot 
Почесний оцифрувальник літератури


З нами з: 28.01.09
Востаннє: 19.10.18
Повідомлень: 3234

2013-03-27 23:18  
vakol, зберігати можна й у стиснений TFF (стиснення LZW), якщо у VueScan є такий варіант — займатиме менше місця.
А для опрацювання спробуйте ScanKromsator — він вирішує подібну проблему. Дивно, що названі вами програми цього не вміють. Можливо, варто ще подлубатися в налаштуваннях?
А ви сканували в кольорі? Чи мається на увазі колір сторінок в паперовому оригіналі?
vakol 
Свій


З нами з: 17.03.11
Востаннє: 04.12.18
Повідомлень: 77

2013-03-28 00:21  
Сканував в кольорі 600 пікс. Спробую, скориставшись Вашою порадою, ScanKromsator. Дякую.
jinotot 
Почесний оцифрувальник літератури


З нами з: 28.01.09
Востаннє: 19.10.18
Повідомлень: 3234

2013-03-28 00:35  
vakol, я для обробки в СканКромсаторі сканую текст ФайнРидером у відтінках сірого на 300 дпі, зберігаю, як вже й казав, у TFF (стиснення LZW). Із цього СканКромсатор робить чорно-білий текст і дає змогу підвищити якість до 600 дпі.
Скиньте мені в приват свою пошту, я вам надішлю простеньку інструкцію для Кромсатора.
coldice 
Свій


З нами з: 20.03.10
Востаннє: 05.12.18
Повідомлень: 142

2013-04-10 09:05  
Привіт! Потрібна Ваша порада по скануванню книжок.

відсканував кольоровий журнал у tiff 300 dpi, зменшив на 50%, колір обрізав до 256,
у ScanKramsator створив pdf якості 80% (31.74MB) http://www.sendspace.com/file/96ey9k

відсканував кольорову брошуру у tiff 300 dpi, відредагував у ScanTailor,
у ScanKramsator створив pdf якості 80% (20.90MB) http://www.sendspace.com/file/54a9vk

Питання: чи припустимо релізити такі pdf? чи потрібно їх стиснути, покращити? якщо так то підкажіть - як? Мені радили звернути увагу на певні артефакти у ділянках фотографій, чи знаєте як їх позбутися?

Дякую Вам!
balik2 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 19.01.11
Востаннє: 10.12.18
Повідомлень: 1351

2013-04-10 09:34  
цілком непогано вийшло, артефакти на фото через стиснення. може порекомендувати початково прогнати скани через фільтр для видалення растру, внаслідок чого артефакти мають зникнути

я відіслав ваш журнал людині яка займається оцифровуванням кольорових видань, як відповість дам знати що можна покращити і як
balik2 
Оцифрування книг Гуртом
Оцифрування книг Гуртом


З нами з: 19.01.11
Востаннє: 10.12.18
Повідомлень: 1351

2013-04-10 15:03  
coldice
подивіться приватні повідомлення
AwN 
VIP


З нами з: 16.08.11
Востаннє: 06.12.18
Повідомлень: 253

2013-07-13 21:52  
Поставив YAGF 0.92 в списку мов чомусь немає української. В папці Tesseract є файл української, так само як і в папці Cuneiform, все одно немає вибору української.
taras1994 
Почесний оцифрувальник літератури


З нами з: 23.03.12
Востаннє: 30.11.16
Повідомлень: 5094

2013-07-13 22:14  
AwN
Мова в програмі не важлива, в моєму комплекті встановлена англійська.
AwN 
VIP


З нами з: 16.08.11
Востаннє: 06.12.18
Повідомлень: 253

2013-07-14 16:15  
taras1994
Я про той список мов, з яких програма має розпізнавати.
Ваш часовий пояс: GMT + 2 Години

Нова тема   Відповісти Сторінка:   попередня  1, 2, 3, 4, 5, 6  наступна