Anonim

Beni sık sık sinirlendiren şeylerden biri, görüntülerin ve belirli PDF dosyalarının (örneğin, taranmış belgelerden oluşturulmuş olanlar) kolayca kopyalanamamasıdır. Neyse ki zaman içinde bu sorunu çözmek için yazılım çözümleri geliştirilmiştir ve bu sayede metni el ile kopyalamak ve yeniden yazmak için harcanacak zamandan önemli ölçüde tasarruf sağlanır. Bugünün ipucunda, resim ve PDF dosyalarından metin yakalayabilmenizi sağlayan Optik Karakter Tanıma (OCR) algoritmasını kullanan Capture2Text adlı ücretsiz bir yazılım aracı hakkında konuşacağım.

Kurulum ve kurulum

Başlamak için projenin SourceForge sayfasına gidin ve Capture2Text'in en son sürümünü indirin. Yazılım bir zip arşivi olarak gelir ve o sırada özel bir yükleyici içermez. Bir kere indirildikten sonra arşivi açın ve Capture2Text.exe dosyasını başlatın. Bu, yazılımı başlatır ve sistem tepsisine bir simge koyar:

İlk olarak, yapmak isteyeceğiniz şey, yazılımın tercihlerini, özellikle de yakalamayı başlatmak ve durdurmak için hangi kısayol tuşlarını kullanacağınızı ayarlamaktır:

Benim durumumda, yakalamaya başlamak için “Windows + q” tuşlarını ve durdurmak için “Enter” tuşlarını kullanmayı seçtim. Bu seçenekleri sizin için en iyi olana göre ayarlayabilirsiniz. “Windows + s” tuşunun ekran yakalama için sıklıkla kullanıldığını unutmayın (örneğin, Microsoft One Note gibi programlar tarafından).

Bir sonraki sekmede, giriş dili (şu anda yedi dil desteklenir) ve doğruluğu artırmak için OCR ön işlemenin kullanılıp kullanılmayacağı (son derece tavsiye edilir) dahil olmak üzere OCR seçenekleri yapılandırılabilir. Son olarak Çıktı sekmesinde, diğer seçeneklerin yanı sıra, yalnızca çekilen metnin panoya kaydedilip kaydedilmeyeceğini veya ayrı bir açılır pencere başlatılıp başlatılmayacağını seçebilirsiniz.

Yazılımın Kullanımı

Yazılım yüklenip yapılandırıldıktan sonra, onu başlatma yakalama kısayol tuşu kombinasyonunuz aracılığıyla kullanmaya başlayabilirsiniz. Farenizi kullanarak, görüntüde yakalamak istediğiniz metni içeren alanı seçin. Çekimi durdurmak için, çekimi durdurmak için seçtiğiniz kısayol tuşuna basmanız yeterlidir. Metin daha sonra panoya, çıktı açılır penceresine veya her ikisine de kopyalanır. Bir örnek aşağıda görülebilir.

Aletin görüntüleri ile hızlı bir şekilde test etmesinden itibaren doğruluğunu iyi buldum. Açıkçası, genel olarak bunun ve OCR gibi araçların sınırlamaları var. Örneğin, yoğun biçimde değiştirilmiş metin (çok el yazısı, italik veya modern) oldukça iyi çalışmayabilir ve bazen hiç çalışmayabilir. Ayrıca, bazı durumlarda daha doğru bir sonuç elde etmek için çekim kutusu boyutlarını hafifçe ayarlamanıza veya görüntünün yakınlaştırmasıyla oynatmaya yardımcı olur.

Taranan PDF belgelerinden metin yakalarken, yakalanan çıktıda (ilk taramanın kalitesine bağlı olarak) genellikle birkaç son değişiklik yapılması gerektiğinden doğruluk doğrudur. Ayrıca, özellikle büyük miktarda metni dönüştürmek istendiğinde yazılımın işleminin birkaç saniye daha uzun sürebileceğini fark ettim.

Bunların hepsi söyleniyor, genel olarak aracın iyi bir iş çıkardığını düşünüyorum, özellikle de serbestçe kullanılabildiğinden - denemenizi tavsiye ediyorum.

Ek 11.06.2015:

Başka bir seçenek olarak, Google hesabı olanlara, Google Drive’ınıza bir dosya yükleyerek Google’ın OCR özelliklerini kullanmak da mümkündür (daha fazla ayrıntı burada bulunabilir). Ayrıca, Google Chrome kullanıcıları için de göz atmak isteyebileceğiniz, Copyfish adlı bir OCR eklentisi bulunmaktadır.

Ocr yazılımıyla görüntülerden metin yakalama