Grafikler, sosyal ağlar, bilgi tabanları, biyolojik sistemler ve çok daha fazlasını içeren çok çeşitli alanlardaki karmaşık ilişkileri temsil eden veri yapılarıdır. Bu grafiklerde varlıklar düğümler olarak temsil edilir ve ilişkileri kenarlar olarak gösterilir.
Bu karmaşık ilişkisel yapıları etkili bir şekilde temsil etme ve bunlar hakkında akıl yürütme yeteneği, ağ bilimi, kimyasal bilişim ve öneri sistemleri gibi alanlardaki ilerlemeleri sağlamak için çok önemlidir.
Grafik Sinir Ağları (GNN'ler), grafik makine öğrenimi görevleri için güçlü bir derin öğrenme çerçevesi olarak ortaya çıkmıştır. Grafik topolojisini komşuluk toplama veya grafik evrişimleri yoluyla sinir ağı mimarisine dahil ederek, GNN'ler hem düğüm özelliklerini hem de bunların yapısal rollerini kodlayan düşük boyutlu vektör temsillerini öğrenebilir. Bu, GNN'lerin çeşitli uygulama alanlarında düğüm sınıflandırması, bağlantı tahmini ve grafik sınıflandırması gibi görevlerde en gelişmiş performansı elde etmesine olanak tanır.
GNN'ler önemli ilerlemeler kaydetmiş olsa da bazı önemli zorluklar devam etmektedir. Denetimli GNN modellerinin eğitimi için yüksek kaliteli etiketli verilerin elde edilmesi pahalı ve zaman alıcı olabilir. Ek olarak, GNN'ler heterojen grafik yapılarıyla ve test zamanındaki grafik dağılımının eğitim verilerinden önemli ölçüde farklı olduğu durumlarla (dağıtım dışı genelleme) mücadele edebilir.
Buna paralel olarak, GPT-4 gibi Büyük Dil Modelleri (LLM'ler) ve aramalar inanılmaz doğal dil anlayışları ve üretim yetenekleriyle dünyayı kasıp kavurdu. Milyarlarca parametre içeren devasa metin külliyatı üzerinde eğitilen LLM'ler, bir zamanlar yapay zeka sistemleri için son derece zorlu olduğu düşünülen olağanüstü az sayıda öğrenme yeteneği, görevler arasında genelleme ve sağduyulu muhakeme becerileri sergiliyor.
Yüksek Lisans'ların muazzam başarısı, keşiflerin grafik makine öğrenimi görevleri için güçlerinden yararlanılmasına yönelik katalizörlük yaptı. Bir yandan, Yüksek Lisans'ların bilgi ve akıl yürütme yetenekleri, geleneksel GNN modellerini geliştirme fırsatları sunuyor. Tersine, grafiklerin doğasında bulunan yapılandırılmış temsiller ve gerçeklere dayalı bilgi, halüsinasyonlar ve yorumlanabilirlik eksikliği gibi LLM'lerin bazı temel sınırlamalarının ele alınmasında etkili olabilir.
Grafik Sinir Ağları ve Kendi Kendini Denetleyen Öğrenme
Gerekli bağlamı sağlamak için, öncelikle grafik sinir ağları ve kendi kendini denetleyen grafik gösterimi öğrenimindeki temel kavramları ve yöntemleri kısaca gözden geçireceğiz.
Geleneksel derin sinir ağları ile GNN'ler arasındaki temel ayrım, doğrudan grafik yapılı veriler üzerinde çalışabilme yeteneklerinde yatmaktadır. GNN'ler, her düğümün kendi temsilini hesaplamak için komşularından gelen özellik vektörlerini topladığı bir mahalle toplama şemasını takip eder.
Daha yakın zamanlarda, grafik transformatörleri, doğal dil transformatörlerinden öz-dikkat mekanizmasının grafik yapılı veriler üzerinde çalışacak şekilde uyarlanmasıyla popülerlik kazanmıştır. Bazı örnekler şunları içerir: GraformerTransformatör, ve Grafik Oluşturucular. Bu modeller, grafik boyunca uzun vadeli bağımlılıkları tamamen mahalle tabanlı GNN'lerden daha iyi yakalayabilir.
Grafiklerde Kendi Kendine Denetimli Öğrenme
GNN'ler güçlü temsili modeller olsa da, denetimli eğitim için gereken büyük etiketli veri kümelerinin eksikliği nedeniyle performansları genellikle darboğaz yaşar. Kendi kendini denetleyen öğrenme, yalnızca içsel grafik yapısı ve düğüm özelliklerini gerektiren bahane görevlerinden yararlanarak GNN'leri etiketlenmemiş grafik verileri üzerinde önceden eğitmek için umut verici bir paradigma olarak ortaya çıktı.
Kendi kendini denetleyen GNN ön eğitimi için kullanılan bazı yaygın bahane görevleri şunları içerir:
Düğüm Özelliği Tahmini: Düğüm özniteliklerinin/özelliklerinin bir kısmının rastgele maskelenmesi veya bozulması ve GNN'e bunları yeniden yapılandırması için görev verilmesi.
Kenar/Bağlantı Tahmini: Genellikle rastgele kenar maskelemeye dayalı olarak, bir çift düğüm arasında bir kenarın olup olmadığını tahmin etmeyi öğrenmek.
Karşılaştırmalı Öğrenme: Farklı grafiklerden görünümleri birbirinden uzaklaştırırken aynı grafik örneğinin grafik görünümleri arasındaki benzerlikleri en üst düzeye çıkarma.
Karşılıklı Bilgi Maksimumlaştırması: Yerel düğüm temsilleri ile küresel grafik yerleştirme gibi bir hedef temsili arasındaki karşılıklı bilgiyi en üst düzeye çıkarmak.
Bunun gibi bahane görevleri, GNN'nin ön eğitim sırasında etiketlenmemiş grafik verilerinden anlamlı yapısal ve anlamsal modeller çıkarmasına olanak tanır. Önceden eğitilmiş GNN daha sonra, düğüm sınıflandırması, bağlantı tahmini ve grafik sınıflandırması gibi çeşitli aşağı yönlü görevlerde başarılı olmak için nispeten küçük etiketli alt kümelere ince ayar yapılabilir.
Kendi kendini denetlemeyi kullanarak, büyük etiketlenmemiş veri kümeleri üzerinde önceden eğitilmiş GNN'ler, sıfırdan eğitime kıyasla daha iyi genelleme, dağıtım değişimlerine karşı dayanıklılık ve verimlilik sergiler. Bununla birlikte, geleneksel GNN tabanlı kendi kendini denetleyen yöntemlerin bazı önemli sınırlamaları devam etmektedir ve bunları daha sonra ele almak üzere Yüksek Lisans'tan yararlanmayı inceleyeceğiz.
LLM'lerin doğal dili, muhakemeyi ve birkaç adımlık öğrenmeyi anlama konusundaki olağanüstü yetenekleri, grafik makine öğrenimi ardışık düzenlerinin birçok yönünü geliştirmek için fırsatlar sunar. Bu alandaki bazı önemli araştırma yönlerini inceliyoruz:
GNN'lerin uygulanmasındaki temel zorluk, özellikle açıklamalar, başlıklar veya özetler gibi zengin metinsel nitelikler içerdiklerinde, düğümler ve kenarlar için yüksek kaliteli özellik temsilleri elde etmektir. Geleneksel olarak, incelikli anlambilimi yakalamakta genellikle başarısız olan basit kelime çantası veya önceden eğitilmiş kelime yerleştirme modelleri kullanılmıştır.
Son çalışmalar, GNN'ye aktarmadan önce daha iyi düğüm/kenar özelliği temsilleri oluşturmak için büyük dil modellerini metin kodlayıcılar olarak kullanmanın gücünü göstermiştir. Örneğin, Chen vd. metinsel düğüm niteliklerini kodlamak için GPT-3 gibi LLM'leri kullanır ve düğüm sınıflandırma görevlerinde geleneksel sözcük yerleştirmelere göre önemli performans kazanımları gösterir.
Daha iyi metin kodlayıcıların ötesinde, LLM'ler orijinal metin niteliklerinden yarı denetimli bir şekilde artırılmış bilgiler üretmek için kullanılabilir. BANT Yüksek Lisans kullanarak düğümler için potansiyel etiketler/açıklamalar oluşturur ve bunları ek artırılmış özellikler olarak kullanır. KEA, bir Yüksek Lisans kullanarak metin özniteliklerinden terimleri çıkarır ve özellikleri artırmak için bu terimler için ayrıntılı açıklamalar elde eder.
Giriş özelliklerinin kalitesini ve ifade edilebilirliğini geliştirerek, LLM'ler üstün doğal dil anlama yeteneklerini GNN'lere aktarabilir ve aşağı akış görevlerindeki performansı artırabilir.
Etiketli Verilere Güvenin Azaltılması
LLM'lerin önemli bir avantajı, geniş metin korporalarına ilişkin ön eğitimleri sayesinde, çok az etiketli veriyle veya hiç etiketlenmemiş veriyle yeni görevlerde makul derecede iyi performans gösterme yetenekleridir. Bu birkaç adımlık öğrenme yeteneği, GNN'lerin büyük etiketli veri kümelerine olan bağımlılığını azaltmak için kullanılabilir.
Bir yaklaşım, doğal dil istemlerinde grafik yapısını ve düğüm bilgisini tanımlayarak grafik görevleri üzerinde doğrudan tahminler yapmak için LLM'leri kullanmaktır. Gibi yöntemler InstructGLM ve GPT4 Grafiği Düğüm bağlantıları, komşuluklar vb. gibi grafik topolojisi ayrıntılarını içeren dikkatlice tasarlanmış istemleri kullanarak LLaMA ve GPT-4 gibi LLM'lere ince ayar yapın. Ayarlanan LLM'ler daha sonra çıkarım sırasında sıfır atışlı bir şekilde düğüm sınıflandırması ve bağlantı tahmini gibi görevler için tahminler üretebilir.
Kara kutu tahmincileri olarak LLM'lerin kullanılması umut verici olsa da, yapının açık bir şekilde modellenmesinin faydalı olduğu daha karmaşık grafik görevleri için performansları düşüyor. Bu nedenle bazı yaklaşımlar LLM'leri GNN'lerle birlikte kullanır; GNN grafik yapısını kodlarken LLM, metin açıklamalarından düğümlerin gelişmiş semantik anlayışını sağlar.
GraphLLM iki stratejiyi araştırır: 1) LLM'lerin GNN'ye geçmeden önce metin düğümü niteliklerini kodladığı Geliştiriciler Olarak LLM'ler ve 2) LLM'nin nihai tahminleri yapmak için GNN'nin ara gösterimlerini girdi olarak aldığı Tahminciler Olarak LLM'ler.
GLEM, karşılıklı iyileştirme için LLM ve GNN bileşenlerinin güncellenmesi arasında geçiş yapan değişken bir EM algoritması önererek daha da ileri gider.
LLM ile geliştirilmiş grafik öğrenme yöntemleri, birkaç atışlık yetenekler ve yarı denetimli artırma yoluyla etiketli verilere olan bağımlılığı azaltarak, yeni uygulamaların kilidini açabilir ve veri verimliliğini artırabilir.
Yüksek Lisans'ları Grafiklerle Geliştirme
LLM'ler son derece başarılı olmasına rağmen, halüsinasyonlar (gerçeklere dayanmayan ifadeler üretme), akıl yürütme süreçlerinde yorumlanabilirlik eksikliği ve tutarlı gerçeklere dayalı bilgiyi sürdürememe gibi temel sınırlamalardan muzdariptirler.
Grafikler, özellikle de güvenilir kaynaklardan alınan yapılandırılmış gerçek bilgileri temsil eden bilgi grafikleri, bu eksikliklerin giderilmesi için umut verici yollar sunmaktadır. Bu yönde ortaya çıkan bazı yaklaşımları inceliyoruz:
Bilgi Grafiği Geliştirilmiş LLM Ön Eğitimi
Yüksek Lisans öğrencilerinin büyük metinler üzerinde önceden eğitilmelerine benzer şekilde, son çalışmalar daha iyi gerçeklere dayalı farkındalık ve muhakeme yetenekleri aşılamak için onlara bilgi grafikleri konusunda ön eğitim vermeyi araştırdık.
Bazı yaklaşımlar, ön eğitim sırasında gerçek KG üçlülerini doğal dil metniyle basitçe birleştirerek veya hizalayarak girdi verilerini değiştirir. E-BERT KG varlık vektörlerini BERT'in kelime parçası yerleştirmeleriyle hizalarken, K-BERT orijinal cümleyi ve ilgili KG üçlülerini içeren ağaçlar oluşturur.
Grafik Makine Öğreniminde Yüksek Lisans'ın Rolü:
Araştırmacılar, yüksek lisans öğrenimlerini grafik öğrenme hattına entegre etmenin, her birinin kendine özgü avantajları ve uygulamaları olan çeşitli yollarını araştırdılar. LLM'lerin oynayabileceği önemli rollerden bazıları şunlardır:
Arttırıcı olarak Yüksek Lisans: Bu yaklaşımda, LLM'ler bir TAG'deki düğümlerle ilişkili metinsel nitelikleri zenginleştirmek için kullanılır. LLM'nin açıklamalar, bilgi varlıkları veya sözde etiketler üretme becerisi, GNN'nin erişebildiği anlamsal bilgileri zenginleştirerek düğüm temsillerinin ve alt görev performansının iyileştirilmesine yol açabilir.
Örneğin, TAPE (Metin Artırılmış Önceden Eğitimli Kodlayıcılar) modeli, daha sonra bir dil modeline ince ayar yapmak için kullanılan alıntı ağı belgeleri için açıklamalar ve sözde etiketler oluşturmak üzere ChatGPT'den yararlanır. Ortaya çıkan yerleştirmeler, düğüm sınıflandırması ve bağlantı tahmini görevleri için bir GNN'ye beslenir ve en son teknolojiye sahip sonuçlar elde edilir.
Bir Tahminci Olarak Yüksek Lisans: Giriş özelliklerini geliştirmek yerine, bazı yaklaşımlar doğrudan LLM'leri grafikle ilgili görevler için tahmin bileşeni olarak kullanır. Bu, grafik yapısının LLM tarafından işlenebilen ve daha sonra düğüm etiketleri veya grafik düzeyindeki tahminler gibi istenen çıktıyı üreten metinsel bir temsile dönüştürülmesini içerir.
Dikkate değer bir örnek, Grafik Modelleme Dili (GML) kullanan grafikleri temsil eden ve sıfır adımlı grafik akıl yürütme görevleri için güçlü GPT-4 LLM'den yararlanan GPT4Graph modelidir.
GNN-LLM Hizalaması: Başka bir araştırma alanı, GNN'ler ve LLM'lerin yerleştirme alanlarını hizalayarak yapısal ve anlamsal bilgilerin kusursuz bir şekilde bütünleştirilmesine olanak sağlamaya odaklanmaktadır. Bu yaklaşımlar GNN ve LLM'yi ayrı yöntemler olarak ele alır ve temsillerini hizalamak için karşılaştırmalı öğrenme veya damıtma gibi teknikler kullanır.
MKS MolekülSTM Örneğin, model, bir GNN ve bir LLM'nin yerleştirmelerini hizalamak için karşıt bir amaç kullanır ve bu sayede LLM'nin GNN'den yapısal bilgiyi dahil etmesini sağlarken GNN de LLM'nin anlamsal bilgisinden yararlanır.
Zorluklar ve Çözümler
Yüksek Lisans ve grafik öğreniminin entegrasyonu büyük umutlar vaat etse de, bazı zorlukların ele alınması gerekiyor:
Verimlilik ve Ölçeklenebilirlik: LLM'ler herkesin bildiği gibi kaynak yoğundur; eğitim ve çıkarım için genellikle milyarlarca parametre ve muazzam hesaplama gücü gerektirir. Bu, LLM ile geliştirilmiş grafik öğrenme modellerinin gerçek dünya uygulamalarında, özellikle de kaynak kısıtlı cihazlarda dağıtılmasında önemli bir darboğaz olabilir.
Umut verici bir çözüm ise bilgi damıtma, büyük bir LLM'den (öğretmen modeli) gelen bilginin daha küçük, daha verimli bir GNN'ye (öğrenci modeli) aktarıldığı yer.
Veri Sızıntısı ve Değerlendirme: Hukuk alanında yüksek lisans (LLM) programları, yaygın kıyaslama veri kümelerinden test kümeleri de dahil olmak üzere, herkese açık büyük miktarda veri üzerinde önceden eğitilmiştir. Bu durum, potansiyel veri sızıntılarına ve aşırı performans tahminlerine yol açabilir. Araştırmacılar, bu sorunu hafifletmek için LLM'nin eğitim kesintisinden sonraki zaman dilimlerinden yeni veri kümeleri toplamaya veya test verileri örneklemeye başlamıştır.
Ek olarak, LLM ile geliştirilmiş grafik öğrenme modelleri için adil ve kapsamlı değerlendirme kriterleri oluşturmak, bunların gerçek yeteneklerini ölçmek ve anlamlı karşılaştırmalar sağlamak için çok önemlidir.
Aktarılabilirlik ve Açıklanabilirlik: LLM'ler sıfır adımlı ve birkaç adımlı öğrenmede üstün olsa da, bilgiyi çeşitli grafik alanları ve yapıları arasında aktarma yetenekleri açık bir zorluk olmaya devam ediyor. Bu modellerin aktarılabilirliğini geliştirmek kritik bir araştırma yönüdür.
Ayrıca, Yüksek Lisans tabanlı grafik öğrenme modellerinin açıklanabilirliğini artırmak, güven oluşturmak ve bunların yüksek riskli uygulamalarda benimsenmesini sağlamak için çok önemlidir. LLM'lerin doğasında var olan muhakeme yeteneklerinden aşağıdaki gibi teknikler aracılığıyla yararlanmak zincirleme düşünce istemi daha iyi açıklanabilirliğe katkıda bulunabilir.
Çok Modlu Entegrasyon: Grafikler genellikle metinsel bilgilerden daha fazlasını içerir; düğümler ve kenarlar, görüntüler, ses veya sayısal veriler gibi çeşitli yöntemlerle potansiyel olarak ilişkilendirilir. LLM'lerin entegrasyonunu bu çok modlu grafik ayarlarına genişletmek, gelecekteki araştırmalar için heyecan verici bir fırsat sunuyor.
Gerçek Dünya Uygulamaları ve Örnek Olay Çalışmaları
Yüksek Lisans ve grafik makine öğreniminin entegrasyonu, çeşitli gerçek dünya uygulamalarında şimdiden umut verici sonuçlar vermiştir:
Moleküler Özellik Tahmini: Hesaplamalı kimya ve ilaç keşfi alanında, moleküler grafiklerden yapısal bilgileri birleştirerek moleküler özelliklerin tahminini geliştirmek için Yüksek Lisans'lar kullanılmıştır. LLM4Mol modeliÖrneğin, moleküllerin SMILES (Basitleştirilmiş Moleküler Giriş Hattı Giriş Sistemi) temsillerine yönelik açıklamalar oluşturmak için ChatGPT'den yararlanır ve bunlar daha sonra özellik tahmin görevlerinin doğruluğunu artırmak için kullanılır.
Bilgi Grafiğinin Tamamlanması ve Muhakeme: Bilgi grafikleri, gerçek dünyadaki varlıkları ve onların ilişkilerini temsil eden özel bir grafik yapısı türüdür. Grafik yapısının ve metinsel bilgilerin (örn. varlık açıklamaları) birlikte değerlendirilmesi gereken bilgi grafiği tamamlama ve akıl yürütme gibi görevler için LLM'ler araştırılmıştır.
Tavsiye Sistemleri: Öneri sistemleri alanında, grafik yapıları genellikle kullanıcı-öğe etkileşimlerini temsil etmek için kullanılır; düğümler kullanıcıları ve öğeleri temsil eder ve kenarlar etkileşimleri veya benzerlikleri belirtir. Kullanıcı/öğe tarafı bilgileri üreterek veya etkileşim kenarlarını güçlendirerek bu grafikleri geliştirmek için LLM'lerden yararlanılabilir.
Sonuç
Büyük Dil Modelleri ve Grafik Makine Öğrenimi arasındaki sinerji, yapay zeka araştırmalarında heyecan verici bir ufuk sunuyor. GNN'lerin yapısal tümevarımsal önyargısını LLM'lerin güçlü anlamsal anlama yetenekleriyle birleştirerek, özellikle metinle ilişkilendirilen grafikler için grafik öğrenme görevlerinde yeni olanakların kilidini açabiliriz.
Önemli ilerlemeler kaydedilmiş olsa da verimlilik, ölçeklenebilirlik, aktarılabilirlik ve açıklanabilirlik gibi alanlarda zorluklar devam etmektedir. Bilginin damıtılması, adil değerlendirme kriterleri ve çok modlu entegrasyon gibi teknikler, LLM ile geliştirilmiş grafik öğrenme modellerinin gerçek dünya uygulamalarında pratik dağıtımının yolunu açıyor.
Son beş yılımı, Makine Öğrenimi ve Derin Öğrenmenin büyüleyici dünyasına dalarak geçirdim. Tutkum ve uzmanlığım, özellikle AI/ML'ye odaklanarak 50'den fazla farklı yazılım mühendisliği projesine katkıda bulunmamı sağladı. Devam eden merakım, beni daha fazla keşfetmeye hevesli olduğum bir alan olan Doğal Dil İşleme'ye de çekti.