Google Vision API'sini kullanarak bir görüntüden çıkarılan metne erişmek için API'nin Optik Karakter Tanıma (OCR) yeteneklerinin kullanılmasını içeren bir dizi adımı uygulayabilirsiniz. Google Vision API'deki OCR teknolojisi, el yazısı da dahil olmak üzere resimlerdeki metinlerin algılanmasını ve çıkarılmasını sağlar. Bu işlevsellik özellikle görsel verilerde mevcut olan metinsel bilgilerin analizini ve anlaşılmasını gerektiren uygulamalarda kullanışlıdır.
Öncelikle Google Vision API ile çalışabilmek için gerekli ortamı kurmanız gerekmektedir. Bu, Google Cloud Console'da bir proje oluşturmayı, Vision API'yi etkinleştirmeyi ve API anahtarı veya hizmet hesabı anahtarı gibi gerekli kimlik doğrulama bilgilerinin alınmasını içerir.
Ortamınız kurulduktan sonra, bir görüntü dosyası üzerinde OCR gerçekleştirmek için Vision API'nin `asyncBatchAnnotateFiles` yöntemini kullanabilirsiniz. Bu yöntem, görüntü dosyalarının bir listesini işlenmek üzere aktarmanıza ve sonuçları eşzamansız olarak almanıza olanak tanır. Alternatif olarak, bir görüntü listesini doğrudan işlemek için "asyncBatchAnnotateImages" yöntemini kullanabilirsiniz.
Bir görüntüden metin çıkarmak için 'AnnotateImageRequest' nesnesinin bir örneğini oluşturmanız ve istediğiniz özellikleri belirtmeniz gerekir. Bu durumda, görüntüden metin çıkarmak istediğinizi belirtmek için 'TEXT_DETECTION' özelliğini ayarlamalısınız. OCR'nin doğruluğunu artırmak için dil ipucu gibi ek parametreler de belirleyebilirsiniz.
Daha sonra, görüntü dosyasını base64 kodlu bir dizeye kodlamanız ve kodlanmış görüntü verilerini kullanarak "Image" nesnesinin bir örneğini oluşturmanız gerekir. Bu 'Image' nesnesi, daha önce oluşturulan 'AnnotateImageRequest' nesnesine eklenmelidir.
İsteği ayarladıktan sonra, seçtiğiniz yaklaşıma bağlı olarak "batchAnnotateImages" veya "batchAnnotateFiles" yöntemini kullanarak bunu Vision API'ye gönderebilirsiniz. API, görüntüyü işleyecek ve çıkarılan metni içeren bir yanıt döndürecektir.
Yanıttan çıkarılan metne erişmek için 'AnnotateImageResponse' nesnesinin 'textAnnotations' alanı üzerinde yineleme yapabilirsiniz. Bu alan, her biri görüntüde algılanan bir metin öğesini temsil eden "EntityAnnotation" nesnelerinin bir listesini içerir. Her bir 'EntityAnnotation' nesnesinin 'açıklama' alanı, çıkarılan metni içerir.
Aşağıda, Google Vision API kullanılarak bir görüntüden çıkarılan metne nasıl erişileceğini gösteren Python'daki örnek bir kod pasajı verilmiştir:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
Bu örnekte "extract_text_from_image" işlevi, giriş olarak bir görüntü dosyasının yolunu alır ve Vision API'ye bir istek göndermek için Google Cloud Vision istemci kitaplığını kullanır. Çıkarılan metin daha sonra yazdırılır.
Google Vision API'yi kullanarak bir görüntüden çıkarılan metne erişmek için ortamı ayarlamanız, istenen özelliklere sahip bir `AnnotateImageRequest` nesnesi oluşturmanız, görüntü dosyasını kodlamanız, isteği API'ye göndermeniz ve çıkarılan metni almanız gerekir. yanıttan. Vision API'nin OCR yetenekleri, el yazısı da dahil olmak üzere resimlerdeki metinlerin algılanmasını ve çıkarılmasını sağlar.
ile ilgili diğer yeni sorular ve cevaplar El yazısından metin algılama ve ayıklama:
- Google Vision API'yi kullanarak karmaşık belgelerden metin ayıklarken ne gibi sınırlamalar ortaya çıkabilir?
- Google Vision API'nin metni yorumlamasında güven düzeylerinin önemi nedir?
- Google Vision API, el yazısı notlardaki metni nasıl doğru bir şekilde tanıyabilir ve çıkarabilir?
- El yazısı görsellerden metin tespit etme ve çıkarmanın zorlukları nelerdir?
- Google Vision el yazısını tanıyabilir mi?