Google Vision API'yi kullanarak bir görselden çıkarılan metne nasıl erişebilirsiniz?

by EITCA Akademisi / Çarşamba, 27 Aralık 2023 / Yayınlandığı Yapay Zeka, EITC/AI/GVAPI Google Vision API, Görsel verilerdeki metni anlama, El yazısından metin algılama ve ayıklama, Sınav incelemesi

Google Vision API'sini kullanarak bir görüntüden çıkarılan metne erişmek için API'nin Optik Karakter Tanıma (OCR) yeteneklerinin kullanılmasını içeren bir dizi adımı uygulayabilirsiniz. Google Vision API'deki OCR teknolojisi, el yazısı da dahil olmak üzere resimlerdeki metinlerin algılanmasını ve çıkarılmasını sağlar. Bu işlevsellik özellikle görsel verilerde mevcut olan metinsel bilgilerin analizini ve anlaşılmasını gerektiren uygulamalarda kullanışlıdır.

Öncelikle Google Vision API ile çalışabilmek için gerekli ortamı kurmanız gerekmektedir. Bu, Google Cloud Console'da bir proje oluşturmayı, Vision API'yi etkinleştirmeyi ve API anahtarı veya hizmet hesabı anahtarı gibi gerekli kimlik doğrulama bilgilerinin alınmasını içerir.

Ortamınız kurulduktan sonra, bir görüntü dosyası üzerinde OCR gerçekleştirmek için Vision API'nin `asyncBatchAnnotateFiles` yöntemini kullanabilirsiniz. Bu yöntem, görüntü dosyalarının bir listesini işlenmek üzere aktarmanıza ve sonuçları eşzamansız olarak almanıza olanak tanır. Alternatif olarak, bir görüntü listesini doğrudan işlemek için "asyncBatchAnnotateImages" yöntemini kullanabilirsiniz.

Bir görüntüden metin çıkarmak için 'AnnotateImageRequest' nesnesinin bir örneğini oluşturmanız ve istediğiniz özellikleri belirtmeniz gerekir. Bu durumda, görüntüden metin çıkarmak istediğinizi belirtmek için 'TEXT_DETECTION' özelliğini ayarlamalısınız. OCR'nin doğruluğunu artırmak için dil ipucu gibi ek parametreler de belirleyebilirsiniz.

Daha sonra, görüntü dosyasını base64 kodlu bir dizeye kodlamanız ve kodlanmış görüntü verilerini kullanarak "Image" nesnesinin bir örneğini oluşturmanız gerekir. Bu 'Image' nesnesi, daha önce oluşturulan 'AnnotateImageRequest' nesnesine eklenmelidir.

İsteği ayarladıktan sonra, seçtiğiniz yaklaşıma bağlı olarak "batchAnnotateImages" veya "batchAnnotateFiles" yöntemini kullanarak bunu Vision API'ye gönderebilirsiniz. API, görüntüyü işleyecek ve çıkarılan metni içeren bir yanıt döndürecektir.

Yanıttan çıkarılan metne erişmek için 'AnnotateImageResponse' nesnesinin 'textAnnotations' alanı üzerinde yineleme yapabilirsiniz. Bu alan, her biri görüntüde algılanan bir metin öğesini temsil eden "EntityAnnotation" nesnelerinin bir listesini içerir. Her bir 'EntityAnnotation' nesnesinin 'açıklama' alanı, çıkarılan metni içerir.

Aşağıda, Google Vision API kullanılarak bir görüntüden çıkarılan metne nasıl erişileceğini gösteren Python'daki örnek bir kod pasajı verilmiştir:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

Bu örnekte "extract_text_from_image" işlevi, giriş olarak bir görüntü dosyasının yolunu alır ve Vision API'ye bir istek göndermek için Google Cloud Vision istemci kitaplığını kullanır. Çıkarılan metin daha sonra yazdırılır.

Google Vision API'yi kullanarak bir görüntüden çıkarılan metne erişmek için ortamı ayarlamanız, istenen özelliklere sahip bir `AnnotateImageRequest` nesnesi oluşturmanız, görüntü dosyasını kodlamanız, isteği API'ye göndermeniz ve çıkarılan metni almanız gerekir. yanıttan. Vision API'nin OCR yetenekleri, el yazısı da dahil olmak üzere resimlerdeki metinlerin algılanmasını ve çıkarılmasını sağlar.

ile ilgili diğer yeni sorular ve cevaplar El yazısından metin algılama ve ayıklama:

Daha fazla soru ve cevap:

Alan: Yapay Zeka
Program: EITC/AI/GVAPI Google Vision API (sertifikasyon programına git)
Ders: Görsel verilerdeki metni anlama (ilgili derse git)
Konu: El yazısından metin algılama ve ayıklama (ilgili konuya git)
Sınav incelemesi

Tagged under: Yapay Zeka, Google Bulut Vizyon API'sı, Görüntü işleme, OCR, Optik Karakter Tanıma, Metin Çıkarma

EITCA Akademisi

Google Vision API'yi kullanarak bir görselden çıkarılan metne nasıl erişebilirsiniz?

ile ilgili diğer yeni sorular ve cevaplar El yazısından metin algılama ve ayıklama:

Daha fazla soru ve cevap:

EITCA Akademisi, Avrupa BT Sertifikasyon çerçevesinin bir parçasıdır

EITCA Academy için uygunluk %80 EITCI DSJC Sübvansiyon desteği

EITCA Akademisi

Kullanıcı adınızı veya e-posta adresinizi alarak hesabınıza giriş yapın

DETAYLARINI UNUTMAYIN?

HESAP OLUŞTUR

Google Vision API'yi kullanarak bir görselden çıkarılan metne nasıl erişebilirsiniz?

ile ilgili diğer yeni sorular ve cevaplar El yazısından metin algılama ve ayıklama:

Daha fazla soru ve cevap:

EITCA Academy için uygunluk %80 EITCI DSJC Sübvansiyon desteği