API'nin Yapay Zeka - Google Vision API - Gelişmiş görüntü anlama - Nesne algılama alanındaki yanıtından tüm nesne açıklamalarını çıkarmak için, algılanan nesnelerin bir listesini ve karşılık gelenlerini içeren API tarafından sağlanan yanıt formatını kullanabilirsiniz. sınırlayıcı kutular ve güven puanları. Bu yanıtı ayrıştırarak istediğiniz nesne açıklamalarını çıkarabilirsiniz.
API yanıtı genellikle, algılanan nesneleri içeren "localizedObjectAnnotations" alanı da dahil olmak üzere çeşitli alanları içeren bir JSON nesnesinden oluşur. Her nesne açıklaması, nesnenin adı, sınırlayıcı kutu koordinatları ve API'nin algılamaya olan güvenini gösteren bir güven puanı gibi bilgileri içerir.
Nesne ek açıklamalarını çıkarmak için şu adımları takip edebilirsiniz:
1. API yanıtını ayrıştırın: API'den alınan JSON yanıtını ayrıştırarak başlayın. Bu, bir JSON ayrıştırma kitaplığı veya programlama diliniz tarafından sağlanan yerleşik işlevler kullanılarak yapılabilir.
2. "localizedObjectAnnotations" alanına erişin: Yanıt ayrıştırıldıktan sonra, algılanan nesneleri içeren "localizedObjectAnnotations" alanına erişin. Bu alan genellikle bir nesne açıklamaları dizisidir.
3. Nesne açıklamalarını yineleyin: Dizideki her nesne açıklamasını yineleyin. Her açıklama, görüntüde algılanan bir nesneyi temsil eder.
4. İlgili bilgileri çıkarın: Nesnenin adı, sınırlayıcı kutu koordinatları ve güven puanı gibi her nesne açıklamasından ilgili bilgileri çıkarın. Bu ayrıntılara her nesne açıklamasında ayrı alanlar olarak erişilebilir.
5. Çıkarılan bilgileri saklayın veya işleyin: Gereksinimlerinize bağlı olarak, çıkarılan bilgileri bir veri yapısında saklayabilir veya analiz veya başka amaçlar için işleyebilirsiniz. Örneğin, nesne adlarını ve bunlara karşılık gelen sınırlayıcı kutu koordinatlarını bir veritabanında saklamak veya bunları daha ileri görüntü anlama görevleri için kullanmak isteyebilirsiniz.
Çıkarma işlemini göstermek için basitleştirilmiş bir örnek:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"orta": "/m/01g317",
"isim": "kedi",
"puan": 0.89271355,
"sınırlayıcıPoli": {
"normalleştirilmişKöşeler": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"orta": "/m/04rky",
"isim": "köpek",
"puan": 0.8132468,
"sınırlayıcıPoli": {
"normalleştirilmişKöşeler": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Bu örnekte, tespit edilen iki nesneyi içeren bir JSON yanıtı varsayıyoruz: bir kedi ve bir köpek. Kod, yanıtı ayrıştırır, "localizedObjectAnnotations" alanına erişir, her nesne açıklamasını yineler ve nesnenin adını, sınırlayıcı kutu koordinatlarını ve güven puanını çıkarır. Son olarak, çıkarılan bilgiler yazdırılır, ancak kodu özel ihtiyaçlarınıza uyacak şekilde değiştirebilirsiniz.
Bu adımları izleyerek API'nin Yapay Zeka - Google Vision API - Gelişmiş görüntü anlama - Nesne algılama alanındaki yanıtından tüm nesne açıklamalarını etkili bir şekilde çıkarabilirsiniz.
ile ilgili diğer yeni sorular ve cevaplar Gelişmiş görüntü anlayışı:
- Google Vision API'de nesne tanımaya yönelik önceden tanımlanmış bazı kategoriler nelerdir?
- Güvenli arama tespit özelliğini diğer denetleme teknikleriyle birlikte kullanmak için önerilen yaklaşım nedir?
- Güvenli arama ek açıklamasında her kategorinin olasılık değerlerine nasıl erişebilir ve bunları görüntüleyebiliriz?
- Python'da Google Vision API'yi kullanarak güvenli arama ek açıklamasını nasıl edinebiliriz?
- Güvenli arama tespiti özelliğinin içerdiği beş kategori nelerdir?
- Google Vision API'nin güvenli arama özelliği görsellerdeki müstehcen içeriği nasıl tespit eder?
- Yastık kütüphanesini kullanarak bir görüntüde tespit edilen nesneleri görsel olarak nasıl tanımlayabilir ve vurgulayabiliriz?
- Çıkarılan nesne bilgilerini pandaların veri çerçevesini kullanarak tablo biçiminde nasıl düzenleyebiliriz?
- Google Vision API'nin işlevselliğini göstermek için hangi kitaplıklar ve programlama dili kullanılıyor?
- Google Vision API, görüntülerde nesne algılamayı ve yerelleştirmeyi nasıl gerçekleştirir?
Gelişmiş görsel anlama bölümünde daha fazla soru ve yanıt görüntüleyin