მარა არ მუშაობს ისე როგორც საჭიროა.
ანუ, Ghostscript ცალკე ოკ, არანაირი პრობლემა.
python მე3 ვერსიაა ლინუქსზე დეფოლტად და ალბათ იქნება შესაძლებელი რომ მე-2-ც დაყენდეს, მაგრამ წვალებად არ ღირს, იმიტომ რომ:
Tesseract ვერ ხსნის ენის ფაილებს, და ანუ უსარგებლოა
თან რამდენიმე სხვადასხვა დისტროზე ვცადე და ყველგან ერთი და იგივეა:
Error opening data file.
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
სოლუშენები რაც დავძებნე არის რომ:
change your tessdata preffix to TESSDATA_PREFIX=/usr/share/tesseract-ocr/4.00/tessdata and all will be good.
მარა ჩემი ფეხები.
ან რაღაცას ვერ ვაკეთებ სწორად, ან რამე დეპენდენსი აკლია, ან ხზ..
მოკლედ დავიკიდე, იმიტომ რომ ცალკე python 2-ზეც საჩალიჩო იქნება დამატებით,
რადგანაც სკრიპტები რომელსაც გატესერაქტებული ტექსტური ფაილებისთვის ვიყენებ არის 2.7 ვერსიისთვის დაწერილი და 3-ზე არ მუშაობს.
მოკლედ, ეს ყველაფერი არის სკანირებული პდფ ფაილების გასაციფრულებლად:
1. ჯერ Ghostscript-ით გადამყავს tif-ში,
2. მერე ტესერაქტით ვაციფრულებ (ამისთვის ქართული ენის დატა ფაილი უნდა წაიკითხოს პროგრამამ)
3. და ბოლოს პითონით ვამატებ აბზაცებს შორის ცარიელ ხაზებს (როცა საჭიროა) და ჰაიფენებს (გადატანებს მარცვლებს შორის).
ჰოდა, იმის გამო რომ მხოლოდ ათასში ერთხელ მჭირდება ეს ყველაფერი, კიდევ უფრო მეტი სოლუშენების ძებნის და რა ჯანდაბა უნდა იმის გამორკვევის ნერვი არ მაქვს, მარტივად ვინდოუსში ვბუთავ სისტემას და იქ ვაკეთებ
მითუმეტეს რომ სხვა რაღაცეებისთვის მაინც ისედაც საჭიროა ვინდოუსი..
¯\_(ツ)_/¯