Tidak lama setelah dilancarkan semula dengan lebih dari 55,000 tangkapan skrin dan pelbagai ciri baru, Pangkalan Data Game UI terbentur dengan rintangan utama.
Edd Coates, pencipta repositori percuma tersebut, perasan bahawa laman web itu "lambat seperti neraka" dan dengan bantuan pakar pelayan Jay Peet, mula menyiasat. Penyelesaiannya sangat mudah. Memblok alamat IP tunggal membolehkan perkhidmatan normal berfungsi semula, tetapi siapakah pemilik kad panggilan digital itu? Tiada lain melainkan OpenAI, firma AI generative di sebalik ChatGPT dan Dall-E.
Pada mulanya, Coates berkongsi berita tersebut di X, dan mengutuk amalan OpenAI merayap laman web untuk maklumat yang boleh digunakan untuk melatih modelnya. Syarikat ini tidak segan silu tentang perkara ini. Laman webnya dengan terang menyatakan bahawa model bahasa besar-besaran mereka dilatih dengan tiga sumber termasuk "maklumat yang tersedia di internet secara awam." Tentu saja, pelbagai saman mahkamah dan cabaran undang-undang berpotensi yang melibatkan akhbar besar (termasuk New York Times) dan pencipta YouTube akan mengatakan bahawa "tersedia secara awam" tidak bermakna sah secara undang-undang (terima kasih The Guardian dan The Verge).
Bagi Coates, isu di sini adalah berbilang. Pertama, dia tidak bersetuju dengan kaedah atau model perniagaan OpenAI, tetapi menjadi sasaran syarikat itu juga merosakkan sumber percuma yang dibina selama lima tahun.
"Saya pertama kali perasan bahawa pangkalan data menghadapi masalah beberapa minggu yang lalu, apabila laman mengambil masa yang lebih lama untuk dimuatkan. Saya tahu ini bukan disebabkan oleh laman tersebut kerana ia sentiasa berfungsi lancar (malah dengan lebih banyak pengguna online yang aktif), jadi saya mencurigai permainan kotor tetapi tidak dapat menemukan bukti pada masa itu," kata Coates kepada Pembangun Game.
"Saya tidak dapat mengeluarkan sebarang pengemaskinian kepada laman kerana lag ini menganggu alat pentadbiran saya, dan saya juga menerima emel dan mesej marah daripada pengguna yang bergantung pada laman tersebut sebagai sebahagian daripada aliran kerja harian mereka."
Beliau menjelaskan gangguan itu pada akhirnya menyebabkan laman web berhenti berfungsi sama sekali, menyiarkan ralat "502 Bad Gateway" kepada pengguna. Pada peringkat itu, Coates mencari bantuan Jay Peet, yang menjalankan pangkalan data di pelayan persendirian mereka untuk lima tahun terakhir. Peet melihat log laman web dan sedar bahawa sumber laman web sedang ditelan oleh alamat IP tunggal milik OpenAI.
"Laman utama dikesan dimuatkan semula 200 kali dalam satu saat, kerana bot [OpenAI] nampaknya mengalami kesulitan untuk bergerak di sekitar laman web dan terperangkap dalam lingkaran berterusan," tambah Coates. "Ini pada dasarnya serangan DDoS selama dua minggu dalam bentuk pencurian data."
Pengasas Pangkalan Data Game UI mempertikaikan bagaimana penyusuran OpenAI itu "adil atau sah?"
Coates tidak mendapat wang daripada Pangkalan Data Game UI. Sebenarnya, beliau menjalankan laman web itu dengan kerugian. Namun, jika mereka cuba untuk memonopoli projek itu atau menggunakan alat luar seperti Amazon Web Services, minat OpenAI yang tidak diingini mungkin telah menyebabkan kerugian kewangan.
"Jika saya bergantung pada [Pangkalan Data Game UI] untuk pendapatan iklan atau yuran keahlian, masa tidak beroperasi disebabkan oleh OpenAI pasti akan memberi kesan kepada pendapatan saya," katanya. "Mereka sedang memindahkan ~70GB data dari pelayan setiap sepuluh minit. Untungnya, saya tidak mempunyai kos lebar jalur dan yuran pelayan minima, jadi saya dapat menyediakan sumber ini kepada semua orang secara percuma (seperti semua sumber pendidikan sepatutnya). Tetapi jika saya membayar AWS untuk penyimpanan, contohnya, lebar jalur ini akan menelan kira-kira £850 sehari."
"OpenAI bahkan tidak telus mengenai daripada mana data mereka datang, jadi saya sendiri yang akan bertanggungjawab atas bil itu. Bagaimana boleh adil atau sah? Dan saya pasti tidaklah orang pertama yang terjejas oleh ini."
Coates berkata isu ini lebih mendalam daripada kerugian potensi pendapatan, bagaimanapun. "Jangan biarkan saya bermula tentang apa yang mereka lakukan dengan data ini," lanjutnya, menunjukkan bahawa beliau telah menghabiskan bertahun-tahun mengumpul dan mengkatalog rujukan UI dengan teliti untuk membantu kreatif lain dalam industri permainan hanya untuk kerja itu (yang merangkumi usaha ribuan pembangun) "dicuri oleh sebuah organisasi berbillion dolar."
Coates berkata idea bahawa OpenAI mempergunakan semula kerja itu untuk "mencederakan dan menggantikan orang-orang yang saya cuba bantu" hanya menambah lukaan. "Ia sangat menyedihkan. Teknologi AI generatif tidak akan wujud tanpa kerja kreatif manusia, dan namun kami di sini adalah yang dikenakan hukuman tanpa pampasan atau pengiktirafan," tambahnya.
Perihal bagaimana Pangkalan Data Game UI berjaya menolak serangan OpenAI, Coates dan Peet akhirnya memblok semua alamat IP berkaitan dengan syarikat itu pada peringkat pelayan HTTP untuk menghalangnya daripada menyusun keluaran baru.
"Apabila saya menyiasat masalah ini, jelas bahawa kami sedang disusuri atau dilepaskan oleh sesuatu. Analisis penggunaan kami menunjukkan 10 pengguna aktif, manakala pelayan sebenar melaporkan 200 hingga 300 permintaan aktif," kata Peet. "Saya mencurigai seseorang cuba melancarkan serangan DDoS terhadap kami atau data diambil secara besar-besaran oleh penjelajah automatik.
"Memblok penjelajah itu tidak terlalu kompleks walaupun kaedah untuk melakukannya boleh rapuh jika OpenAI menambah atau menukar mana-mana daripada alamat IP yang digunakan. Selepas memodifikasi robots.txt (yang OpenAI boleh abaikan jika mereka mahu) saya secara jelas telah menghalang semua alamat IP OpenAI di peringkat pelayan HTTP. Selepas beralih ke konfigurasi baru, laman web segera kembali kepada masa tindak balas biasa."
Pada masa penulisan, Pangkalan Data Game UI kembali beroperasi dengan cemerlang dan memperjuangkan kerja UI yang terdapat dalam hampir 1,400 tajuk–termasuk projek yang malang seperti Concord. Pembangun Game telah menghubungi OpenAI untuk mengemukakan komen.