Persaingan AI makin panas – dan sekarang sudah ada datanya secara resmi.
Berdasarkan laporan terbaru dari platform TrackingAI per April 2026, yang kemudian divisualisasikan oleh Visual Capitalist, para model AI kini diuji menggunakan tolok ukur yang cukup unik yaitu Tes IQ Mensa Norwegia. Hasilnya ? Skor model-model terbaik melonjak tajam dibanding tahun lalu, dan gap di antara mereka makin tipis.
Kalau di 2025 skor tertinggi ada di angka 135, tahun ini sudah tembus 145. Bukan cuma satu model yang sampai di sana – malah dua sekaligus.
Grok dan GPT-5 Seri di Posisi Teratas
Dua model yang berhasil mencapai skor IQ 145 adalah :
- Grok-4.20 Expert Mode – besutan xAI, perusahaan AI milik Elon Musk
- OpenAI GPT-5.4 Pro (Vision) – model unggulan terbaru dari OpenAI
Keduanya benar-benar seri – tidak ada yang unggul satu poin pun. Ini jadi bukti nyata betapa ketatnya kompetisi di antara lab AI kelas dunia saat ini.
Tepat di belakang mereka, Gemini 3.1 Pro Preview dari Google masuk di posisi ketiga dengan skor 141, diikuti GPT-5.4 Thinking (Vision) dengan skor 139. Selisih antar model di papan atas benar-benar hanya beberapa poin – sesuatu yang sangat berbeda dari beberapa tahun lalu ketika satu model bisa unggul jauh dari yang lain.
Model AI China Makin Diperhitungkan
Kalau kamu pikir podium ini cuma didominasi perusahaan Amerika, ternyata tidak sepenuhnya benar.
Qwen 3.5 dari raksasa e-commerce China, Alibaba, masuk peringkat ke-10 dengan skor 130 – skor yang sama dengan Claude-4.6 Opus milik Anthropic. Selain itu, beberapa nama dari China juga nangkring di daftar :
- Kimi K2.5 – skor 127
- Manus – skor 115
- DeepSeek R1 – skor 112
- DeepSeek V3 – skor 111
Ini sinyal kuat bahwa ekosistem AI China bukan sekadar ikut-ikutan – mereka benar-benar bersaing di level global.
Gimana Cara Tesnya ?
TrackingAI menggunakan 35 teka-teki pola visual dari Tes IQ Mensa Norwegia – tes yang biasanya dipakai untuk manusia. Cara penerapannya dibagi dua:
- Model non-vision (teks saja): Pertanyaan visual “diterjemahkan” dulu jadi deskripsi verbal sebelum dikirim ke model.
- Model vision (multimodal): Gambar dikirim langsung tanpa modifikasi.
Satu hal menarik: kalau model menolak menjawab, pertanyaan yang sama akan diajukan ulang hingga maksimal 10 kali. Jawaban terakhir yang dipakai sebagai nilai akhir.
?? Catatan penting: Karena ada perbedaan cara penyajian soal antara model vision dan non-vision, perbandingan langsung antar keduanya perlu dilakukan dengan hati-hati.
IQ Tinggi Bukan Berarti AI-nya Paling Canggih
Ini bagian yang penting untuk dipahami: skor IQ bukan satu-satunya ukuran kecerdasan AI.
Tes Mensa Norwegia hanya mengukur kemampuan pengenalan pola visual abstrak – satu aspek saja dari banyak hal yang dibutuhkan AI dalam penggunaan nyata. Tes ini tidak mencerminkan:
- Kemampuan coding
- Akurasi fakta dan informasi
- Penggunaan tool eksternal
- Performa di bidang profesional spesifik
Jadi, kalau kamu mau pilih AI untuk pekerjaan teknis atau riset, angka IQ di sini belum tentu jadi patokan terbaik. Tapi sebagai gambaran evolusi kemampuan penalaran mesin dari tahun ke tahun? Sangat berguna.
Daftar Lengkap Skor IQ Model AI – April 2026
Peringkat Model AI Skor IQ 1 Grok-4.20 Expert Mode 145 1 OpenAI GPT-5.4 Pro (Vision) 145 3 Gemini 3.1 Pro Preview 141 4 OpenAI GPT-5.4 Thinking (Vision) 139 5 OpenAI GPT-5.3 136 6 Grok-4.20 Expert Mode (Vision) 133 7 OpenAI GPT-5.4 Thinking 133 8 Meta Muse Spark 133 9 Gemini 3.1 Pro Preview (Vision) 132 10 Qwen 3.5 130 11 Claude-4.6 Opus 130 12 Kimi K2.5 127 13 Manus 115 14 DeepSeek R1 112 15 DeepSeek V3 111 16 Gemini 3.1 Flash Preview 110 17 Llama 4 Maverick 110 18 OpenAI GPT-5.3 (Vision) 109 19 Claude-4.6 Sonnet 106 20 Bing Copilot 101 21 Perplexity 97 22 Mistral Medium 3.1 96 23 Claude-4.6 Sonnet (Vision) 94 24 Claude-4.6 Opus (Vision) 82 25 Llama 4 Maverick (Vision) 79 26 OpenAI GPT-5.4 Pro (non-vision) 73 Sumber: TrackingAI, April 2026 – via Visual Capitalist
Kesimpulan : Race to the Top Makin Sengit
Yang paling menarik dari data ini bukan siapa yang menang – tapi seberapa tipis perbedaannya. Di 2025, satu model bisa jauh unggul dari yang lain. Di 2026, selisih antar model di papan atas hanya beberapa poin.
Artinya ? Tidak ada lagi satu AI yang benar-benar “sendirian” di puncak. Persaingannya makin sehat, makin cepat, dan makin global – dengan China kini benar-benar ikut bertarung di level teratas.










