Mengenal Sora, AI generatif yang Digadang Bakal Mengguncang Industri Kreatif Global

SUARAMANADO, Jakarta : Pada pertengahan Februari lalu, OpenAI mengumumkan sistem AI generatif baru bernama Sora, yang menghasilkan video pendek dari perintah teks.

Meskipun Sora belum tersedia untuk umum, kualitas tinggi dari sampel yang dipublikasikan sejauh ini telah memicu reaksi gembira dan prihatin.

Contoh video yang diterbitkan oleh OpenAI, yang menurut perusahaan dibuat langsung oleh Sora tanpa modifikasi, menunjukkan keluaran dari petunjuk seperti “video close-up fotorealistik dari dua kapal bajak laut yang saling bertarung saat mereka berlayar di dalam secangkir kopi” dan “rekaman sejarah California selama demam emas”.

Pada pandangan pertama, seringkali sulit untuk mengatakan bahwa video tersebut dihasilkan oleh AI, karena kualitas video yang tinggi, tekstur, dinamika pemandangan, pergerakan kamera, dan tingkat konsistensi yang baik.

Kepala eksekutif OpenAI Sam Altman juga memposting beberapa video ke X (sebelumnya Twitter) yang dihasilkan sebagai tanggapan atas permintaan yang disarankan pengguna, untuk menunjukkan kemampuan Sora.
Bagaimana cara kerja Sora?

Sora menggabungkan fitur alat penghasil teks dan gambar dalam apa yang disebut “model transformator difusi”. Transformers adalah jenis jaringan saraf yang pertama kali diperkenalkan oleh Google pada tahun 2017.

Jaringan ini terkenal karena penggunaannya dalam model bahasa besar seperti ChatGPT dan Google Gemini.

Model difusi, sebaliknya, adalah dasar dari banyak generator gambar AI. Mereka bekerja dengan memulai dengan noise acak dan mengulanginya menuju gambar “bersih” yang sesuai dengan perintah masukan.

Sebuah video dapat dibuat dari rangkaian gambar tersebut. Namun, dalam sebuah video, koherensi dan konsistensi antar frame sangatlah penting. Sora menggunakan arsitektur transformator untuk menangani bagaimana frame berhubungan satu sama lain.

Meskipun transformator pada awalnya dirancang untuk menemukan pola dalam token yang mewakili teks, Sora malah menggunakan token yang mewakili bagian kecil ruang dan waktu.

Memimpin Persaingan

Sora bukanlah model teks-ke-video pertama. Model sebelumnya mencakup Emu oleh Meta, Gen-2 oleh Runway, Difusi Video Stabil oleh Stability AI, dan baru-baru ini Lumiere oleh Google.

Lumiere yang baru dirilis beberapa pekan sebelumnya diklaim mampu menghasilkan video lebih baik dibandingkan pendahulunya.

Tapi Sora tampaknya lebih kuat daripada Lumiere setidaknya dalam beberapa hal. Sora dapat menghasilkan video dengan resolusi hingga 1920×1080 piksel, dan dalam berbagai rasio aspek, sedangkan Lumiere dibatasi hingga 512×512 piksel.

Video Lumiere berdurasi sekitar 5 detik, sedangkan Sora membuat video berdurasi hingga 60 detik. Lumiere tidak bisa membuat video yang terdiri dari beberapa gambar, sedangkan Sora bisa.

Sora, seperti model lainnya, juga dilaporkan mampu melakukan tugas pengeditan video seperti membuat video dari gambar atau video lain, menggabungkan elemen dari video berbeda, dan memperluas video dalam waktu.

Kedua model menghasilkan video yang sangat realistis, tetapi mungkin mengalami halusinasi. Video Lumiere mungkin lebih mudah dikenali sebagai video yang dibuat oleh AI. Video Sora terlihat lebih dinamis, lebih banyak interaksi antar elemen. Namun, dalam banyak contoh video, ketidakkonsistenan terlihat jelas setelah diperiksa lebih dekat.

Aplikasi yang menjanjikan

Konten video saat ini diproduksi dengan memfilmkan dunia nyata atau dengan menggunakan efek khusus, yang keduanya bisa memakan banyak biaya dan waktu.

Jika Sora tersedia dengan harga yang wajar, orang mungkin mulai menggunakannya sebagai perangkat lunak pembuatan prototipe untuk memvisualisasikan ide dengan biaya yang jauh lebih rendah.

Berdasarkan apa yang kita ketahui tentang kemampuan Sora, ia bahkan dapat digunakan untuk membuat video pendek untuk beberapa aplikasi di bidang hiburan, periklanan, dan pendidikan. Makalah teknis OpenAI tentang Sora berjudul “Model pembuatan video sebagai simulator dunia”.

Makalah ini berpendapat bahwa versi generator video yang lebih besar seperti Sora mungkin merupakan “simulator dunia fisik dan digital yang mumpuni, serta objek, hewan, dan manusia yang hidup di dalamnya”.

Tak salah dengan berbagai kelebihannya, Sora berpotensi mengguncang industri kreatif di seluruh dunia.

Sumber : selular.id

Leave a Reply

Your email address will not be published. Required fields are marked *