Reddit, Tumblr, WordPress: Yapay zeka modellerini eğitmek için verilerinizi satacak anlaşmalar

Eğer internette herhangi bir şey yayınladıysanız, muhtemelen verileriniz zaten kazındı, toplandı ve yapay zeka sistemlerini eğitmek için kullanıldı ChatGPT'ye güç verenler gibi, Yolculuk ortasıVe Sora. Üretken yapay zeka, genel bir uzman olarak başarılı olmak için tasarlandı ve OpenAI, bunu yapmayı öğrenmenin şunları gerektirdiğini söyledi:internet ölçeğinde” üzerinde eğitim verilecek veriler.

Şirketler haber makalelerinden, kitaplardan ve yaratıcı projelerden halka açık verileri (çoğunlukla onu oluşturanların izni olmadan) kullanarak yapay zeka araçlarına haber makalelerinin nasıl oluşturulacağını öğrettiğinde ne olduğunu muhtemelen size söylememe gerek yok. , kitaplar ve yaratıcı projeler.

New York Times şu anda dava açmak OpenAI'nin geniş arşivlerini sohbet robotlarını eğitmek için izinsiz kullandığı iddiası (son zamanlarda yapılan bir başvurudaOpenAI, Times'ı, chatbot'un içeriklerini çaldığını kanıtlamak için ChatGPT'yi hackleyecek birini işe almakla suçladı). Getty Images, Stabil Difüzyon'a dava açtı telif hakkı ihlali nedeniyle. Eserlerinin yapay zeka modellerini eğitmek için kullanıldığını öğrenen yazarlardan ve yaratıcılardan gelen diğer davalar, mahkemede aksiliklerle karşılaştılar.

Diğer şirketler de karar verdi anlaşma yapmak. Associated Press'in arşivlerinin bir kısmı OpenAI'ye lisanslandı. Stok fotoğraf arşivi olan Shutterstock, altı yıllık anlaşma imzaladı Fotoğraf, video ve müzik veritabanlarına erişimi de içeren eğitim verilerini sağlamak için OpenAI ile birlikte.

Yapay zeka sistemlerinin gazetecilerin, müzisyenlerin ve fotoğrafçıların çalışmalarını kullanma biçimlerinin, bilgi ve kültürel ekosistemimiz ile yapay zeka şirketlerinin tam olarak kararsız göründüğü alanlarda çalışan insanlar için oldukça önemli sonuçları var. değiştirecek araçlar geliştirmek. Mümkün olduğunca az sorunla giderek daha fazla eğitim verisi toplama ihtiyacı, ister bir fandom Tumblr hesabı, ister aktif bir Reddit varlığı veya kişisel bir blog olsun, çevrimiçi poster yapan herkesin, şirket tarafından satılan içeriklerine erişimi görebileceği anlamına gelir. bunu büyük yapay zeka şirketlerinden birine barındıran platformlar.

Aşağıda, en iyi gönderilerinizi eğitim verileri olarak kimin satabileceği hakkında şu anda bildiklerimize dair kısa bir kılavuz bulunmaktadır.

Tumblr ve WordPress.com

Bu haftanın başlarında, 404 Medya Tumblr ve WordPress'in ana şirketi Automattic'in, kullanıcı verilerini OpenAI ve Midjourney'e satan anlaşmaları duyurmaya hazırlandığını bildirdi. Böyle bir anlaşmanın “yakında” olduğunu belirten 404'ün raporuna göre, veriler muhtemelen Tumblr ve WordPress.com'daki kullanıcı gönderilerini içeriyor gibi görünüyor. 404'ün raporundan bir gün sonra Çarşamba günü Automattic, kullanıcıların vazgeçmek ile ilgili herkese açık içeriklerini paylaşma üçüncü taraflarla.

Tumblr personel duyurusu Değişiklik, her şeyi şirketin kullanıcılarını korumaya çalıştığının bir işareti olarak çerçeveledi. Duyuruda, “Yapay zeka tarayıcılarının Tumblr'dan içerik toplamasını zaten engelliyoruz ve bunu yapmaya devam edeceğiz,” diyordu, “ortak olduklarımız dışında.”

Automattic yaptığı açıklamada, “planları topluluğumuzun önemsediği şeylerle uyumlu olduğu sürece seçilmiş yapay zeka şirketleriyle doğrudan çalıştığını” söyledi: ilişkilendirme, devre dışı bırakma ve kontrol.” OpenAI ve Midjourney.

Her ne kadar Tumblr'ın kültürel ağırlık sahip olmak son on yılda azaldıhala güzel fandom içeriği için önemli bir platformHayran kurgusu ve hayran sanatı dahil. Ayrıca orijinal çalışmalarını sunmak ve komisyon almak için Tumblr'ı kullanan çok sayıda sanatçı var.

Reddit

Reddit'in muazzam gönderi arşivi, gönüllülerin emeğiyle şekilleniyor: Ücretsiz alt reddit moderatörleri, ücretsiz kullanıcılardan oluşan toplulukları denetler. Reddit'teki kolektif çabaları platformu değerli kılıyor.

Reddit bir halka arz başlatacağını duyurduğunda şirket, erken hisse satın alma fırsatı sunmak için çeşitli modlara ve sık sık posterlere ulaştı. Teklifi alanlardan bazıları bu konuda pek hevesli değildik. Ancak Reddit'in, kullanıcıların çalışmalarından kâr elde etmek için onların desteğine ihtiyacı yok: Zaten kullanıcıların gönderilerine erişimi şu kişilere sattı: Google.

Halka arz duyurusundan hemen önce, Reddit ve Google bir içine girdi 60 milyon dolarlık anlaşma bu verirdi Reddit'in API'sine Google erişimi diğer şeylerin yanı sıra üretken yapay zeka modellerini eğitmek için.

Dürüst olmak gerekirse diğer her şey

Yukarıda bildirilen anlaşmalar, halka açık hale gelen sadece birkaç anlaşmadır. Ancak bu, internetteki gönderileriniz üzerinde halihazırda büyük yapay zeka modellerinin eğitilmediği anlamına gelmiyor.

Geçen yıl, Washington Post incelendi Biri devasa veri kümeleri Üretken yapay zeka modellerini eğitmek için kullanılan kamuya açık internet verilerinin bir kısmı, World of Warcraft mesaj panolarından Patreon ve Kickstarter'a ve kişisel bloglardan oluşan birçok büyük havuza kadar her şeyi buldu. Ve bu bir sürpriz olmamalı Meta herkese açık gönderileri kullanıyor itibaren Facebook Ve instagram AI modellerini eğitmek için.

Kaynak bağlantısı

Popular Articles

Latest Articles

Other Articles

R­e­d­d­i­t­,­ ­T­u­m­b­l­r­,­ ­W­o­r­d­P­r­e­s­s­:­ ­Y­a­p­a­y­ ­z­e­k­a­ ­m­o­d­e­l­l­e­r­i­n­i­ ­e­ğ­i­t­m­e­k­ ­i­ç­i­n­ ­v­e­r­i­l­e­r­i­n­i­z­i­ ­s­a­t­a­c­a­k­ ­a­n­l­a­ş­m­a­l­a­r­

Popular Articles

Latest Articles

Other Articles

Reddit, Tumblr, WordPress: Yapay zeka modellerini eğitmek için verilerinizi satacak anlaşmalar