Hukuk Fakültesi Dergi Projesi - Gelişmeler (2)
Dergi projesinde kullanacağımız tarayıcı perşembe günü geldi. Alınan tarayıcı HP Scanjet 8390.
Tek taraflı (simplex) modda 35, çift taraflı (duplex) modda 70 sayfayı bir dakika içinde tarayabiliyormuş bu yazıcı. Elbette gerçek kullanımda biz bu hızları yakalayamayacağız.
İki bilgisayarla birlikte tarayıcıyı fakültedeki bir odaya yerlestirdik. Tarayıcının bağlı olduğu bilgisayar yine bir HP. 2.4 ghz. hızında AMD Athlon 64 işlemcisi, 512 MB belleği (RAM) ve 80 GB’lik SATA harddiski var. Bu bilgisayarın belleğini 2 GB’ye yükselltim. Bu bilgisayara bir de 1 adet 250 GB’lik harddisk ekleyeceğim. (Tarama için tercih ettiğim TIFF formatındaki dosyalar oldukça büyük yer kaplıyor.) Tarayıcı gayet kullanışlı tarama (scan) ve optik karakter tanıma (OCR) yazılımlarıyla beraber geldi. Tarayıcı ve bağlı olduğu bilgisayar 400-500 sayfalık bir dergiyi 300 dpi çözünürlükle 25-30 dakika’da hem tarayabiliyor hem de içeriğini yazıya dönüştürebiliyor. Eğer 600 dpi çözünürlüğe çıkarsak sadece tarama işlemi bir saati aşabiliyor. HP’nin yazılımı 300 dpi ile 600 dpi arasındaki seçeneklere izin vermiyor. 300 dpi çözünürlük ekranda çok tatminkar gözükmese de yaptığım denemeler 600 dpi ile arasında sadece dikkatli bir gözün yakalayabileceği kadar az fark olduğunu ortaya koyduğu için taramaları 300 dpi’da yapmaya karar verdim. (Bir ara buraya 300 dpi ve 600 dpi ile taranmış sayfaların örneklerini koyarım.)
Kullandığımız ikinci bilgisayar YÖNSİS marka 3.2 ghz. hızında Intel P4 işlemcisi, 512 MB belleği ve 80 GB (sanırım SATA) harddiski olan bir bilgisayar. Bu bilgisayarın belleğini 1 GB’ye yükselttim. Muhtemelen bu bilgisayara da bir 250 GB’lik harddisk takmam gerekecek. Bu ikinci bilgisayar sadece optik karakter tanıma (OCR) için kullanılıyor.
Her iki bilgisayar ağ üzerinden birbirlerine bağlı. Birinde tarama işlemi yapılırken diğerinde tanıma ve işlemi yapılabiliyor. Böylelikle zaman kaybı minimuma indiriliyor.
Tarayacının ve iki bilgisayarın başında üç öğrenci arkadaşım çalışıyorlar. Dergileri cilt cilt tarayıp, makale makale ayırıyor; OCR yazılımı ile okutup, içinde yazı gizli olan resim PDF formatında kaydediyorlar. Her bir cilt taranıp, içindeki makaleler ayrı ayrı PDF dosyalarına dönüştürüldükten sonra fakülte öğretim elemanlarının hazırladıkları künye ve anahtar sözcükler PDF dosyalarının`özellikler` kısmına giriliyor. Her bir dosya belli bir sisteme göre adlandırılıyor ve klasörleniyor. Dijital ortama aktarılan deriglein belki ileride aynı basımını yapma ihtiyacı doğar diye taranan orijinal TIFF dosyaları da saklanıyor.
Hazırlanan PDF dosyaları OCR yazılımından istifade edilerek hazırlandığı için her bir makalenin içinde tam metin araması yapılabilecek. Ayrıca, öğretim elemanlarının çıkardıkları künyeler ve özellikle de anahtar sözcükler PDF dosyalarının özelliklerine işlendiği için Google gibi arama motorları makaleleri çok daha iyi indeksleyebilecek.
Niye doğrudan yazı PDF yerine resim + gizli yazı PDF yapmayı tercih ettiğimi merak edenleriniz var ise (ki bu yönde sorular aldığım için yazıyorum) yanıtı şu: OCR ile yazıya dönüşüm işlemini gerçekleştirdikten sonra yazıları kontrol edip hatalarını düzeltmek çok zaman alacaktı. Her bir ciltte 4 sayı var. Her sayıda ortalama 10 makale var desek, 56 cilt çarpı 4 sayı çarpı 10 makaleden 2240′ın üzerindeki makaleyi satır satır, kelime kelime kontrol etmek gerekiyor tümüyle yazı PDF seçeneğini gerçekleştirebilmek için. Bunu yapabilecek/yapmak isteyen kimse yok; zaman da yok. Hedefim 20-25 gün içinde bütün dergileri makale makale PDF haline getirmek. Bu aşamadan sonra dergileri fakültenin sunucusuna yerleştirmek ve ayrıca içinde arama yapılabilir CD haline getirmek gerekecek ki bu işleri doğru düzgün şekilde yapmak biraz daha vakit alacak.
Daha önceki yazımda sunucuya Açık Dergi Sistemi yazılımını kurduğumu aktarmıştım. Bu yazılım bir harika ama eski dergilerin yayınlanması bakımından işimize yaramayacak. Yeni sayılar bakımından bile kullanabileceğimizi sanmıyorum. Çok daha basit - ve mümkünse gene kaynak kodu açık - bir yazılım bulmam gerekiyor…
Dergi projesini tamamladıktan sonra fakültenin yayınladığı diğer eserlerin (özellikle de piyasa bulunamayan eski eserlerin) dijital ortama aktarılmasına gelecek sıra. Bir kaç gündür fakültenin depolarındaki kitaplar elden geçiriliyor, birer birer temizleniyor. Ben bunlardan ikişer üçer tanesini tarama işlemlerini yaptığımız odaya taşıttırıyorum. Duvarlar kitaplıklarla, kitaplıklar kitaplarla doldu. Daha gelecek o kadar çok kitap var ki… Meğer ne çok kitap yayınlamış bizim fakültemiz.
Bu yazi ile ilgili yazıları da okuyabilrisiniz:
Hukuk Fakültesinin Yeni Sunucusu
Hukuk Fakültesi Dergi Projesi - Gelişmeler (1)
Hukuk Fakültesi Dergi Projesi - Gelişmeler (2)
Hukuk Fakültesi Dergi Projesi - Gelişmeler (3)
Bölüm: AÜHF, Hukuk, Pro(c)eler, Teknoloji, Türkiye'ye Armağan Projesi |
