Heboh! Induk TikTok Sedang Kumpulkan Fakta Besar-besaran, Ada Apa?

Photo of author

By Fitri Rafifah

Ledifha.com – CHINA – ByteDance, perusahaan induk TikTok yang dimaksud berbasis di tempat China, tampaknya ingin mengejar ketertinggalan di perlombaan Artificial Intelligence (AI) generatif.

Mereka baru sekadar meluncurkan web crawler atau scraper bot sendiri yang dimaksud dijuluki Bytespider pada April 2024 silam, menurut riset dari Kasada, perusahaan yang berspesialisasi di manajemen bot. Keberadaan bot ini juga dikonfirmasi oleh Dark Visitors, yang tersebut memantau aktivitas scraper bot.

Bytespider: Scraper Paling Agresif dalam Internet

Riset menunjukkan bahwa Bytespider dengan cepat menjadi salah satu scraper paling agresif di dalam internet. Mesin yang dimaksud mengakumulasi data dengan kecepatan yang digunakan jarak jauh melampaui perusahaan besar lainnya, seperti Google, Meta, Amazon, OpenAI, kemudian Anthropic, yang digunakan juga menggunakan scraper bot untuk merancang lalu meningkatkan model bahasa besar atau model multimodal mereka (LLM/LMM).

“Sejak Bytespider muncul, ia sudah pernah mengakumulasi data dengan kecepatan sekitar 25 kali lipat dari GPTbot, yang tersebut menghimpun data untuk wadah Asisten Percakapan GPT Open Artificial Intelligence dan juga model-model dasarnya,” beber Sam Crowther, ketua eksekutif Kasada.

Bytespider juga mengoleksi data dengan kecepatan 3.000 kali lipat dari ClaudeBot (Anthropic), yang tersebut mengoperasikan wadah Claude.

Aktivitas Scraping Meningkat

Menurut Kasada, Bytespider menjadi semakin agresif pada mengakumulasi data. Fakta menunjukkan lonjakan besar pada aktivitas scraping dari Bytespider selama enam minggu terakhir.

Kontroversi Web Scraping

Web scraping sudah pernah ada selama beberapa dekade, khususnya dilaksanakan oleh mesin pencari untuk menghimpun tautan ke halaman web. Namun, kebangkitan alat Kecerdasan Buatan generatif telah lama menambahkan dimensi baru lalu menjadikan praktik ini sumber gugatan serta kontroversi.

Individu lalu organisasi yang tersebut karyanya diambil berpendapat bahwa hak cipta merek dilanggar pada proses tersebut.

Semua model yang mendasari alat Artificial Intelligence generatif dilatih dengan beberapa orang besar data online, yang pada dasarnya adalah semua yang mana tersedia dalam web, teristimewa informasi tertulis. Perusahaan teknologi menggunakan scraper bot untuk menyalin semua itu secara gratis serta memasukkannya ke pada set data mereka.

ByteDance Mengejar Ketertinggalan

Tahun lalu, ByteDance dilaporkan sangat tertinggal di perlombaan Teknologi AI generatif sehingga mereka menggunakan Open Artificial Intelligence untuk membantu mendirikan LLM ByteDance sendiri, yang bertentangan dengan ketentuan layanan OpenAI.

Awal tahun ini, ByteDance merilis LLM berbasis chat yang tersebut disebut Duabo, tetapi pengembangan model itu sudah pernah selesai sebelum akumulasi data pelatihan yang tersebut tambahan baru yang digunakan dikumpulkan oleh Bytespider.

LLM Baru serta Fungsi Pencarian TikTok

Menurut sumber internal perusahaan , ByteDance sedang mengembangkan LLM baru. Salah satu tujuannya adalah untuk meningkatkan fungsi pencarian di area TikTok.

Minggu lalu, TikTok merilis pembaruan untuk fungsi pencariannya yang digunakan berfokus pada kata kunci untuk iklan, yang mana pada dasarnya memungkinkan pengiklan untuk mencari kata-kata yang tersebut sedang tren di tempat TikTok secara real-time.

Hal ini memungkinkan pemasar untuk menciptakan iklan dengan kata kunci yang digunakan relevan yang tersebut seharusnya membantu iklan yang dimaksud muncul pada layar lebih lanjut banyak pengguna.

Model Teknologi AI baru dengan data tentang tren lalu topik internet terbaru dapat memperluas lalu meningkatkan lingkungan pencarian TikTok lebih tinggi lanjut.

“Mengingat audiens kemudian jumlah total penggunaan, TikTok dengan lingkungan pencarian yang digunakan benar-benar dapat ditawar dengan kata kunci dan juga topik, itu akan sangat menarik bagi berbagai orang yang dimaksud menghabiskan banyak bujet dengan Google pada waktu ini,” tulisseorangsumber.

Leave a Comment