Evrişimli sinir ağları (CNN'ler) ilk olarak bilgisayarlı görme alanında görüntü tanıma amacıyla tasarlandı. Bu ağlar, görsel verilerin analizinde oldukça etkili olduğu kanıtlanmış özel bir tür yapay sinir ağıdır. CNN'lerin gelişimi, görüntüleri doğru bir şekilde sınıflandırabilen ve kategorize edebilen modeller oluşturma ihtiyacından kaynaklanmıştır ve bu alandaki başarıları, bunların nesne algılama, görüntü bölümleme ve hatta doğal dil işleme gibi diğer çeşitli uygulamalarda yaygın şekilde kullanılmasına yol açmıştır.
CNN'ler insan beynindeki görsel korteksin yapısından ve işlevselliğinden ilham alıyor. Görsel korteks gibi, CNN'ler de girdi verilerinin farklı yönlerini işleyen birden fazla birbirine bağlı nöron katmanından oluşur. CNN'lerin en önemli yeniliği, manuel özellik mühendisliği ihtiyacını ortadan kaldırarak otomatik olarak öğrenme ve görüntülerden ilgili özellikleri çıkarma yeteneklerinde yatmaktadır. Bu, kenarlar, köşeler ve dokular gibi çeşitli görsel desenleri ve özellikleri tespit etmek için giriş görüntüsüne filtreler uygulayan evrişimli katmanların kullanılmasıyla elde edilir.
CNN'lerdeki ilk atılım, Yann LeCun ve arkadaşlarının LeNet-5 mimarisinin tanıtılmasıyla geldi. LeNet-1998, özellikle el yazısı rakam tanıma için tasarlandı ve görüntü tanıma algoritmalarını değerlendirmek için yaygın olarak kullanılan bir kıyaslama veri seti olan MNIST veri setinde olağanüstü bir performans elde etti. LeNet-5, CNN'lerin görüntülerden hiyerarşik özellikler yakalamadaki gücünü gösterdi; ölçek, döndürme ve çeviride farklılıklar olsa bile doğru sınıflandırmayı mümkün kıldı.
O zamandan beri CNN'ler önemli ölçüde gelişti, daha derin ve daha karmaşık mimariler geliştirildi. Dikkate değer gelişmelerden biri Alex Krizhevsky ve arkadaşları tarafından AlexNet mimarisinin tanıtılmasıydı. 2012 yılında AlexNet, ImageNet Büyük Ölçekli Görsel Tanıma Yarışmasını (ILSVRC) önceki yaklaşımlara kıyasla çok daha düşük bir hata oranıyla kazanarak görüntü sınıflandırmasında bir atılım gerçekleştirdi. Bu başarı, CNN'lerin görüntü tanıma görevlerinde yaygın olarak benimsenmesinin yolunu açtı.
CNN'ler aynı zamanda diğer bilgisayarlı görme görevlerine de başarıyla uygulanmıştır. Örneğin, nesne tespitinde CNN'ler, bir görüntü içindeki nesneleri yerelleştirmek ve sınıflandırmak için ek katmanlarla birleştirilebilir. Ross Girshick ve diğerleri tarafından tanıtılan ünlü Bölge Tabanlı Evrişimli Sinir Ağı (R-CNN). 2014 yılında böyle bir mimarinin örneğidir. R-CNN, CNN'lerin özellik çıkarma gücünden yararlanarak ve bunu bölge öneri yöntemleriyle birleştirerek nesne algılama kıyaslamalarında en son teknolojiye sahip sonuçlara ulaştı.
Evrişimli sinir ağları ilk olarak bilgisayarlı görme alanındaki görüntü tanıma görevleri için tasarlandı. Görüntülerden ilgili özellikleri otomatik olarak öğrenerek, manuel özellik mühendisliği ihtiyacını ortadan kaldırarak bu alanda devrim yarattılar. CNN'lerin gelişimi, görüntü sınıflandırma, nesne algılama ve diğer çeşitli bilgisayarlı görme görevlerinde önemli ilerlemelere yol açmıştır.
ile ilgili diğer yeni sorular ve cevaplar EITC/AI/ADL Gelişmiş Derin Öğrenme:
- Makine öğreniminde neden optimizasyon uygulamamız gerekiyor?
- Aşırı uyum ne zaman ortaya çıkar?
- Evrişimli Sinir Ağları, Konvolüsyonel Diziden Diziye modellerde kullanıldığı gibi, zaman içindeki kıvrımları birleştirerek sıralı verileri işleyebilir mi?
- Üretici Düşman Ağları (GAN'lar), bir üretici ve bir ayrımcı fikrine mi dayanıyor?