"Osmanlıca metinleri çözümleme yapabilmek" ifadesini pek anlayamadım. Önce bunu bir açıklayabilir misin?
Bahsettiğin eğer transkripsiyon ise, Pardus işletim sisteminin böyle bir yeteneğinin olduğunu hiç duymadım. Duyduğun kaynağı bana bildirebilirsen daha ayrıntılı cevap yazabilirim.
Yayımlanması ile birlikte kamuoyunda büyük ilgi gören Pardus’un geliştiricileri, bir karakter seti olmadığı için bilgisayar ortamında varlığını sürdüremeyen Osmanlıca için harekete geçti. Pardus sürümlerinin Osmanlıca’yı desteklemeye başlamasıyla, Osmanlıca metinler ilk kez metin tabanlı olarak elektronik ortama aktarılma olanağına kavuştu. Taranan Osmanlıca belgelerin hatasız bir şekilde metin haline çevrilip, başka bilgisayarlarda görüntülenmesini sağlayacak “Osmanlıca Karakter Seti”, arşiv çalışmalarını önemli ölçüde kolaylaştıracak. Osmanlıca metinlerin elektronik ortama aktarılması, özellikle araştırmacılara Osmanlı Devleti arşivlerinin taranmasına büyük olanaklar sağlayacak. Bir karakter seti olmadığı için Osmanlı arşivleri elektronik ortama yalnızca görsel olarak aktarılabilmekteydi. Mikrofilm, tüm dünyada kullanılan ve asıl amacı belgeleri yok olmaya karşı korumak olan bir “saklama” yöntemi. Fotoğraf tabanlı olduğundan, belgelere “güvenli erişimin” dışında araştırmacılara terim, kavram, sözcük bazlı tarama olanağı sağlamıyor. Mikrofilmlerde tutulan Osmanlı arşivlerinde metin bazlı taramalar yapılamıyor. Mikrofilmlere aktarılan Osmanlı arşivlerinde özel bir olaya ve kişiye ilişkin yapılmak istenen araştırmalarda, neredeyse iki milyon mikrofilme tek tek bakmak zorunda kalınıyor. Mikrofilmlerin dışında, bazı yerlerde “çok sınırlı sayıda” belge, günümüz Türkçesine de çevrilerek saklanıyor. Ancak ortaya çıkan metin bir “çeviri” olduğundan, “belge” niteliğini kaybediyor. Projenin Hikayesi 700 yıllık Osmanlı arşivlerinin gerçek anlamda elektronik ortama aktarılması, Ankara Üniversitesi Dil Tarih Coğrafya Fakültesi Felsefe Bölümü Bilim Tarihi Anabilim Dalı Öğretim Görevlisi Ali Rıza Tosun’un başlattığı girişimler ile gerçekleşti. Tosun, uzun çabalar sonunda TSE’den 13026 numaralı “Osmanlıca harflerin Türkçe klavyeye uyarlanması” isimli standardın yayınlanmasını sağladı. Tosun’un yaklaşık 6 yıl süren “Osmanlıca karakter seti” mücadelesi, "yazılım devlerinin" Türkiye ofislerinin kapısını aşındırmakla devam etti. Çok uluslu yazılım şirketleri ölü ve yalnızca araştırmacıların kullanacağı bir dil için kaynak ayırmak istemediler. Osmanlıca’nın metin tabanlı olarak aktarılması için girişimlerini sürdüren Tosun, son çare olarak TÜBİTAK Ulusal Kriptoloji Enstitüsü bünyesinde faaliyetlerini yürütülen Pardus ekibi ile temas kurdu. Pardus ekibi, TSE standardını ve Linux içinde bulunan karakter setlerini ve araçları incelediktensonra bu karakter setinin kısa sürede hazırlanabileceğini tespit etti.
Osmanlıca belgelerin hatasız bir şekilde metin haline çevrilip bunun başka bilgisayarlarda doğru şekildegörüntülenmesini sağlayacak “Osmanlıca Karakter Seti”, Pardus ekibi tarafından yapılan bu çalışmayla ilk defa hayata geçti.
böyle bir haber okudum ama sadece haberini okudum hayata geçtiğine dair kimse birşey yazmamış birde size sorıyım dedim hocam
Sanırım bu karakter seti, daha tanıdık bir ifadeyle "yazı tipi" ile ilgili. Pardus da bunun desteğini veriyor. Herhangi bir metni eski yazıyla yazmak zaten mevcut bilgisayarlarla yapılabiliyor (sınav sorularını ben böyle hazırlıyorum.
Yukarıda bahsedilen şey ise, OCR (Optical Character Recognition/Optik Karakter Tanıma) ile ilgili sanırım. Yani eski yazı bir metni resim dosyası olarak bilgisayarınıza kaydediyorsunuz, Pardus ise onu herhangi bir metin dosyasına (mesela word formatına .doc/.docx gibi) aktarabiliyor.
Benim anlayabildiğim bu... Dediğim gibi, eğer "metin çözümleme"den kastın "transkripsiyon" ise, bunu yapan bir program geliştirilmedi henüz...(inşallah böyle bir şey vardır )