Sudut Anderson
Apakah AI Dapat Mengembangkan Hidung untuk Berita?

AI semakin baik dalam menulis cerita berita, tetapi tidak banyak memperbaiki mengidentifikasi mereka.
Opini Di lima tahun sejak saya terakhir melihat kemampuan AI untuk menemukan cerita berita panas, lanskap telah berubah secara signifikan, dengan peningkatan level automasi yang didorong oleh AI yang diiringi dengan pertumbuhan nyeri dan kontroversi.
Baru-baru ini, sebuah laporan WSJ tentang kontributor Fortune yang prolifik dan didukung AI mempresentasikan jurnalis masa depan sebagai terbebas dari pekerjaan kasar seperti transliterasi rilis pers, meninggalkan mereka ruang untuk menulis fitur dan melakukan penggalian yang hanya publikasi besar biasanya memiliki anggaran untuk.
Tapi apa yang kita dengar tentang lebih sedikit adalah kemampuan AI untuk menemukan sebuah cerita berita.
Pengurangan Kebisingan
Di tahun 2021, saya berkonsentrasi pada penulis yang meliput beat penelitian, karena itu adalah tempat saya menghabiskan sebagian besar waktu; dan mungkin efek terbesar yang revolusi AI baru ini telah memiliki pada itu adalah bahwa itu menciptakan badai salju yang tidak terkendali dari pengajuan kertas penelitian yang didukung AI, meningkatkan rasio sinyal-ke-kebisingan sehingga tinggi bahwa bahkan meliput domain AI terkait Arxiv secara komprehensif sekarang diluar upaya satu orang.
Pasti ini adalah tempat AI unggul – pada mengulang melalui truk data besar yang manusia tidak dapat menyelesaikannya, untuk menemukan ‘penyimpangan’ (yang kita akan bahas sebentar lagi) dalam detik yang akan memakan waktu orang berhari-hari, jika mereka bisa melakukannya sama sekali.
Mengapa, maka, AI masih sangat buruk dalam mengidentifikasi cerita berita panas dari ribuan, bahkan puluhan ribu, kontender harian?
AI yang Terbelakang
Proliferasi besar konten yang dihasilkan AI ini terjadi jauh melampaui sektor akademik yang saya diskusikan sebelumnya. Akhir tahun lalu diperkirakan bahwa setengah dari semua penulisan baru di web sekarang ‘ditulis oleh AI’, dengan percepatan yang lebih besar dari tren ini diasumsikan akan datang. Oleh karena itu, kebisingan sangat keras di mana-mana, tidak hanya di akademik.
Meskipun telah ada beberapa kemajuan dalam identifikasi AI/algoritma dari ‘cerita panas’ dalam beberapa tahun terakhir, sistem ini cenderung berkonsentrasi pada struktur data yang terstruktur dan dapat diprediksi, yang berarti bahwa mereka hanya dapat beroperasi dalam konteks yang agak rapuh.
Dalam hal ini, peneliti post-doktor Stanford dan mantan jurnalis New York Times Alexander Spangher telah membuat beberapa upaya untuk mendefinisikan ‘keberitaan’ dalam istilah yang dapat diterapkan pada proses pembelajaran mesin dan analisis statistik; dan telah menghasilkan bukti dari pembangkitan lead otomatis dalam korpus seperti pengajuan pengadilan, tagihan negara, dan pertemuan dewan kota, serta dokumen publik umum – jenis output skema yang didorong oleh Fortune yang dapat menghasilkan 6-7 potongan berita sehari:
… (terjemahan dilanjutkan sesuai dengan instruksi)












