Neden değerlendirme eğitim için %80 ve değerlendirme için %20 ama tam tersi değil?

by Nguyen Xuan Tung / Perşembe, 17 Ağustos 2023 / Yayınlandığı Yapay Zeka, EITC/AI/GCML Google Cloud Makine Öğrenimi, Makine Öğreniminde ilk adımlar, Makine öğreniminin 7 adımı

Makine öğrenimi bağlamında eğitime %80 ağırlık ve değerlendirmeye %20 ağırlık tahsisi, birkaç faktöre dayanan stratejik bir karardır. Bu dağıtım, öğrenme sürecini optimize etmek ile modelin performansının doğru bir şekilde değerlendirilmesini sağlamak arasında bir denge kurmayı amaçlar. Bu yanıtta, bu seçimin arkasındaki nedenleri araştıracağız ve sunduğu didaktik değeri keşfedeceğiz.

%80 eğitim ve %20 değerlendirme ayrımının arkasındaki mantığı anlamak için makine öğreniminin yedi adımını anlamak çok önemlidir. Veri toplama, veri hazırlama, model eğitimi, model değerlendirme, model ayarlama, model devreye alma ve model izlemeyi içeren bu adımlar, makine öğrenimi modelleri oluşturmak için kapsamlı bir çerçeve oluşturur.

İlk adım olan veri toplama, modeli eğitmek için ilgili verilerin toplanmasını içerir. Bu veriler daha sonra ön işleme tabi tutulur ve veri hazırlama aşamasında hazırlanır. Veriler hazır olduğunda, modelin kalıpları ve ilişkileri öğrenmek için eğitim veri setine maruz kaldığı model eğitimi aşaması başlar. Modelin performansı daha sonra model değerlendirme aşamasında ayrı bir veri seti kullanılarak değerlendirilir.

%80 ağırlığı eğitime ve %20 ağırlığı değerlendirmeye ayırma kararı, eğitimin modelin verilerden öğrendiği birincil aşama olduğu gerçeğinden kaynaklanmaktadır. Eğitim sırasında model, tahmin edilen çıktıları ile eğitim veri kümesindeki gerçek çıktılar arasındaki farkı en aza indirmek için dahili parametrelerini ayarlar. Bu süreç, gradyan iniş gibi optimizasyon algoritmalarını kullanarak modelin parametrelerini yinelemeli olarak güncellemeyi içerir.

Eğitime daha yüksek bir ağırlık atayarak, modelin verilerden öğrenme ve karmaşık kalıpları yakalama becerisine öncelik veriyoruz. Eğitim aşaması, modelin bilgisini edindiği ve görünmeyen veriler üzerinde tahminler yapmak için eğitim veri setinden genelleme yaptığı yerdir. Model ne kadar çok eğitim verisine maruz kalırsa o kadar iyi öğrenebilir ve genelleyebilir. Bu nedenle, değerlendirme sürecinin önemli bir bölümünü eğitime ayırmak, modelin etkili öğrenme için eğitim verilerine yeterli düzeyde maruz kalmasını sağlar.

Öte yandan, değerlendirme aşaması, modelin görünmeyen veriler üzerindeki performansını değerlendirmede çok önemli bir rol oynar. Eğitim veri setinden ayrı olan değerlendirme veri seti, gerçek dünya senaryoları için bir temsil görevi görür. Modelin öğrenmesini yeni ve görülmemiş örneklere ne kadar iyi genelleştirebileceğini ölçmemize olanak tanır. Belirli problem alanına bağlı olarak, modelin performansının değerlendirilmesi, doğruluğunu, kesinliğini, hatırlamasını veya diğer ilgili ölçümlerini ölçmek için esastır.

Değerlendirmeye verilen %20'lik ağırlık, modelin görünmeyen veriler üzerinde titizlikle test edilmesini ve yeteneklerinin gerçekçi bir şekilde değerlendirilmesini sağlar. Bu değerlendirme aşaması, modelin tahminlerindeki fazla uydurma, yetersiz uydurma veya sapma gibi potansiyel sorunları ortaya çıkarmaya yardımcı olur. Ayrıca, performansı iyileştirmek için hiperparametrelerin ve model mimarisinin ince ayarını sağlar.

Bu kavramı açıklamak için, pratik bir örnek ele alalım. Kedi ve köpek görüntülerini sınıflandırmak için bir makine öğrenimi modeli eğittiğimizi varsayalım. Eğitim aşamasında model, etiketlenmiş görüntülerden oluşan geniş bir veri kümesini analiz ederek kedilerin ve köpeklerin özellikleri arasında ayrım yapmayı öğrenir. Model ne kadar çok görüntü üzerinde eğitebilirse, iki sınıf arasında ayrım yapmada o kadar iyi olur.

Eğitim tamamlandıktan sonra model, daha önce hiç görmediği görüntüleri içeren ayrı bir veri seti kullanılarak değerlendirilir. Bu değerlendirme aşaması, modelin öğrenmesini genelleştirme ve yeni, görünmeyen görüntüleri doğru bir şekilde sınıflandırma becerisini test eder. Değerlendirmeye %20 ağırlık ayırarak, modelin performansının, etkinliğinin güvenilir bir ölçüsünü sağlayarak, görünmeyen veriler üzerinde kapsamlı bir şekilde değerlendirilmesini sağlıyoruz.

Makine öğreniminde %80 ağırlığın eğitime ve %20 ağırlığın değerlendirmeye dağıtılması, modelin performansının doğru bir şekilde değerlendirilmesini sağlarken öğrenme sürecini optimize etmeyi amaçlayan stratejik bir seçimdir. Değerlendirme sürecinin önemli bir bölümünü eğitime ayırarak, modelin verilerden öğrenme ve karmaşık kalıpları yakalama becerisine öncelik veriyoruz. Eşzamanlı olarak, değerlendirme aşaması, modeli görünmeyen veriler üzerinde titizlikle test ederek, yeteneklerinin gerçekçi bir değerlendirmesini sağlar.

ile ilgili diğer yeni sorular ve cevaplar EITC/AI/GCML Google Cloud Makine Öğrenimi:

EITC/AI/GCML Google Cloud Machine Learning'de daha fazla soru ve yanıt görüntüleyin

Daha fazla soru ve cevap:

Alan: Yapay Zeka
Program: EITC/AI/GCML Google Cloud Makine Öğrenimi (sertifikasyon programına git)
Ders: Makine Öğreniminde ilk adımlar (ilgili derse git)
Konu: Makine öğreniminin 7 adımı (ilgili konuya git)

Tagged under: Yapay Zeka, Veri Hazırlama, Makine öğrenme, Model Değerlendirmesi, Model Eğitimi, Optimizasyon Algoritmaları

EITCA Akademisi

Neden değerlendirme eğitim için %80 ve değerlendirme için %20 ama tam tersi değil?

ile ilgili diğer yeni sorular ve cevaplar EITC/AI/GCML Google Cloud Makine Öğrenimi:

Daha fazla soru ve cevap:

EITCA Akademisi, Avrupa BT Sertifikasyon çerçevesinin bir parçasıdır

EITCA Academy için uygunluk %80 EITCI DSJC Sübvansiyon desteği

EITCA Akademisi

Kullanıcı adınızı veya e-posta adresinizi alarak hesabınıza giriş yapın

DETAYLARINI UNUTMAYIN?

HESAP OLUŞTUR

Neden değerlendirme eğitim için %80 ve değerlendirme için %20 ama tam tersi değil?

ile ilgili diğer yeni sorular ve cevaplar EITC/AI/GCML Google Cloud Makine Öğrenimi:

Daha fazla soru ve cevap:

EITCA Academy için uygunluk %80 EITCI DSJC Sübvansiyon desteği