Masalah Rujukan Palsu pada LLM Komersial
Sudah beberapa kali saya meminta ChatGPT menyebutkan rujukan tulisan yang dia buat (bukan web search), hasilnya 70 % mengarah ke link yang tidak ada atau buku fiktif ...
Ini menegaskan bahwa LLM Komersial tidak menjadikan algoritma penyertaan rujukan pada data pelatihan sebagai sesuatu yang penting.
Pada akhirnya ini bisa menyebabkan ekosistem hak karya intelektual menjadi rusak dan batasan-batasannya menjadi tidak jelas. Lebih jauh akan menyebabkan validitas artikel yang dihasilkan oleh LLM menjadi sulit untuk dipertanggungjawabkan.
Karenanya pendekatan seperti Retrieval-Augmented Generation (RAG) atau Fine-tuning pada corpus terbatas atau Citation-aware LLM menjadi penting pada pada proyek-proyek LLM Open Source berbasis komunitas.