Bilgisayar Görmesi ve Görüntü İşlemede Yeni Bir Dönem: Kapsül Ağı Yöntemi

christopher-burns-271403-unsplash_800x445-1

2012 Yılında Geoffrey Hinton, makinelerin dünyayı görme sistemini değiştirdi. Toronto Üniversitesinde profesör olarak görev yapan Hinton, iki yüksek lisans öğrencisiyle birlikte binlerce fotoğrafı analiz edebilen ve çiçek, araba gibi ortak kullanımdaki nesneleri yüksek doğrulukta tanımlamayı –uygulaması oldukça zor bir teknoloji- kendine kendine öğrenebilen bir sistem kurdu.

Kısa bir süre sonra öğrencileriyle birlikte Google’a giden Hinton, ürettikleri sistemi çalıştırabilecek matematiksel yöntemi (Sinir Ağı Sistemi) tüm dünyaya bildirdi. Özellikle otonom araçların, hareket halinde iken karşılaşacakları trafik levhaları veya yayalar gibi varlıkları tanıyabilmeleri için bu sistemin kullanıldığını belirtmekte fayda var.

Fakat Profesör Hinton, ortaya koydukları fikrin bazı durumlarda sınırlı olduğunu söylüyor. Buna göre bir kahve fincanını tanımak için eğitilmiş olan sistem, aynı kahve fincanı ters çevrildiğinde fincanı tanımıyordu. Dolayısıyla istenmeyen sorunlar ortaya çıkabiliyordu.

Şimdilerde genç bir Google araştırmacısı olan Sara Sabour ve Geoffrey Hinton , “Kapsül Ağı” adını verdikleri alternatif bir matematik tekniği üzerinde çalışma yapıyor. Bu alternatif fikrin amacı, insanın görme yöntemini temel alarak insan gibi görebilen sistemler üretebilmek. Yani bir sinir ağı dünyayı iki boyutlu görebiliyorken kapsül ağı yöntemiyle üç boyutlu görme gerçeğe dönüşebilecek.

71 yaşında bir İngiliz göçmen olan Bay Hinton, Google’ın yapay zekâ laboratuvarını 2017 yılında Toronto’da açtı. Bu yeni laboratuvar, bazı bilim insanları için en ileri araştırma teknolojilerinin geleceğini ifade eden bir sembol konumunda. Birçoğu Amerika Birleşik Devletleri dışında olmak üzere, Avrupa’da, Çin’de ve bahsettiğimiz gibi Toronto’da bulunan araştırma merkezleri, göçmen bilim insanlarına kapılarını açıyor ve onlara oldukça sıcak davranıyor.

Sara Sabour, Washington Üniversitesinde bilgisayar ile görme araştırmaları yapmak isteyen İranlı bir bilim insanı. Fakat ABD hükümeti vizesini iptal etti. Günümüzde Toronto’da kendisine sunulan araştırma imkânlarından faydalanıyor. Görevi, Profesör Hinton’un kavramsal fikrini matematiksel bir gerçeğe dönüştürmek ve projenin meyvelerini vermesini sağlamak. Yakın zamanda, geliştirdikleri yöntemin, belirli durumlarda, bilinmeyen açılardan bakarken nesneleri daha doğru tanıyabildiğini gösteren bir makale yayımladılar.

Sabour, geliştirdikleri sistemin başarısını şu şekilde dile getirdi: ”Birçok araştırmacının kullandığı sinir ağı sisteminden çok daha iyi genelleme yapabilir.”

Piramitlerin Sırrı

Hinton, bir gün kendisini ziyaret eden gazeteciyi test etmek için ona düğmeye benzeyen iki büyük beyaz kalıp verdi ve kalıpların bir piramidin yarım parçaları olduğunu belirttikten sonra onları tekrar birleştirerek piramidi yeniden inşa edip edemeyeceğini sordu. Bu çok da zor görünmemiş olsa gerek ki gazeteci hemen işe koyuldu ama kalıplar ona oldukça garip bir şekilde göründü. Her birinin beş kenarı vardı. Gazetecinin tek yapması gereken eşleşen ve aynı hizada olan iki kenarı bulmaktı fakat yapamadı.

Pek çok insan bu sınavda başarısız oluyordu. Hinton bu durumu şu sözlerle açıklıyor: ”Massachusetts Teknoloji Enstitüsünde görev yapan iki kadrolu profesörden biri bu testi denemeyi reddetti. Bir diğeri ise kendisine vereceğim iki kalıbın bir piramit oluşturmasının imkânsız olduğunu belirtti. Aslında bunu başarmak mümkün fakat hepimiz başarısız olduk çünkü yapbozun ayrık parçaları, bizim doğal görme sistemimizi engelledi ve bir piramit inşa etmemizin önünü tıkadı. Bizler bir nesneye önce ayrılmış bir kenarından daha sonra diğer tarafından -yani iki boyutta- baktığımızda onu tanımlamakta zorluk çekiyoruz. Her şeyi, üç boyutlu uzayda var oldukları sürece anlamlandırmak ise oldukça kolay bir iş. Yapboz piramidi ikiye böldüğü için normalde yaptığımız gibi üç boyutlu alanda görmemizi engelliyor. ”

28torontoai-jumbo_800x445 — Geoffrey Hinton ve Sara Sabour, bahsettiğimiz piramidin parçalarını tutarken görüntüleniyorlar
*Fotoğraf: Christopher Wahl*

Kapsül Ağları Yöntemi

Hinton, kapsül ağları sistemini kullanarak aynı insanlar gibi makinelerin de üç boyutlu perspektife sahip olmasını sağlayıp bir nesnenin herhangi bir kenarının nasıl göründüğünü öğrendikten sonra bir diğer açıdan baktıklarında onu yeniden tanımlayabilmelerini amaçlıyor. Bu işlemin, sinir ağları sistemi kullanılarak yapılması pek de mümkün görünmüyor.

Hinton: “Kapsül ağları yöntemi, bilgisayar ile görme
araştırmacıları tarafından göz ardı edilen bir gerçek ve bu çok büyük bir
hata.” diyerek açıklamada bulunuyor.

İnsan beyninde genel hatlarıyla modellenen nöral
ağlar ve sinir ağları, büyük miktarlardaki veri kalıplarını tanımlayarak ayrık
görevleri öğrenebilen algoritmalardır diyebiliriz. Örneğin bir sinir ağı,
binlerce araba fotoğrafını analiz ederek bir arabayı tanımayı öğrenebilir. Bu
matematiksel düşüncenin kökeni 1950’lere dayanıyor.

Bununla birlikte geçtiğimiz yıllarda, internet yoluyla üretilen yüksek boyutlu veriler ve işleme gücünün ilerlemesi sayesinde güncel uygulamalar üretildi. Son beş yılda sinir ağları, akıllı telefonların dijital asistanlarından dil çeviri hizmetlerine ve özerk robotlara kadar her şeyin ilerleyişini hızlandırdı. Ancak bu yöntem, gerçek zamanlı bilgi sunan ve doğru yorumlamalar yapan makineler üretmekten hâlâ çok uzak. Bunun yanında etkileşimli bilgisayarlar ve sürücüsüz araçlar üreten şirketler de dâhil olmak üzere en iyi teknoloji şirketlerinin pek çoğu şimdiden vaat ettikleri otonom makineleri sunabilmek için yeni araştırmalara ihtiyaç duyuyor.

Yapay zekâ için bir çeşit vaftiz babası sayılan Hinton, toplumu ve sanayiyi bu çeşit araştırma sahalarına sokmak için çalışan küçük ama gittikçe gelişen yerel uzmanlar gurubunun küçük bir parçası.

Seattle merkezli Allen Yapay Zekâ Enstitüsü’nün genel müdürü Oren Etzioni, endüstrinin geleceği görememe sorununun sonlandığını bildirdi. Sinir ağları üzerindeki mevcut odağın, uzun vadede yapay zekânın ilerlemesine zarar vereceğini söyleyerek Hinton’ın fikirlerini destekleyici açıklamalarda bulundu.

Microsoft’ta yapay zekâ çalışmalarının birçoğunun denetiminden sorumlu olan Eric Horvitz ise sinir ağlarının ve ilgili tekniklerin, gelecek yıllarda ortaya çıkacak teknolojilere kıyasla küçük ilerlemeler olduğunu savundu ve sözlerine şu şekilde devam etti: ” Şu anda, yaptığımız şey bir bilim değil, bir tür simya.”

Sonuç

Profesör Hinton, Toronto’daki projesi yoluyla şimdiye kadar yalnızca ön sonuçlar elde ettiğini kabul ediyor. Ve diğer araştırmacılar da, Bay Etzioni ve Bay Horvitz gibi, gerçek akıllı makineler elde etmek için çok farklı tekniklerin gerekli olacağına inanıyor. Bay Etzioni, makine öğrenme yöntemlerinin yapay zekânın merkezinde kalacağını söyledi. Bununla birlikte makine öğrenme yönteminin farklı tekniklerle güçlendirilmesi gerekliliğini de vurguladı. Bunun nedeni makine öğrenmesinin temel olarak sınırlı oluşudur diyebiliriz. Makineler veriler yoluyla öğrenirler fakat doğru veri her zaman kullanılabilir değildir. (Bu noktada güvenli veri kavramını genişletebilmek için etiketlenmiş verileri araştırmanızı tavsiye ederim.)

Ancak Bay Hinton, kapsül ağlarının nihayetinde daha geniş bir yelpazeye sahip olabileceğini savunmasının yanı sıra bilgisayar ile görme sistemlerinin ilerleyişine ve karşılıklı bilgi işlem gibi teknolojilere hız vereceğine de inanıyor. Kapsül ağlarının, beynin nöron ağlarını daha karmaşık ve yapılandırılmış bir şekilde taklit etme girişimi olduğunu belirten Hinton, bu ilave yapının diğer yapay zekâ biçimlerine de yardımcı olabileceğini söylüyor.

Hinton, pek çok insanın, geliştirdiği tekniğe kuşkuyla yaklaşacağından emin. Ancak bundan yedi yıl önce sinir ağları sisteminin oldukça büyük tartışmalara yol açtığı ve başlangıçta kabul edilmeyerek -tıpkı kapsül ağları sistemine olduğu gibi- kuşkulara sebep olduğu göz ardı edilmemelidir.

“Tarih tekerrürden ibarettir”

*TheNew York Times'ın İnternet sitesinde yayımlanan "A New Way for Machines to See, Taking Shape in Toronto" adlı yazının özgün çevirisidir.

Kaynakça

www.nytimes.com