
Google telah mengambil langkah penting dalam strateginya untuk kecerdasan buatan terbuka Dengan pelancaran Gemma 4, satu keluarga model baharu bertujuan untuk menggabungkan tahap penaakulan yang tinggi dengan keperluan perkakasan yang jauh lebih sederhana. Syarikat ini mempersembahkan generasi ini sebagai alternatif yang serius bagi mereka yang perlu menjalankan AI canggih pada infrastruktur mereka sendiri, daripada peranti mudah alih hinggalah pusat data.
Jauh daripada menjadi model tunggal, Gemma 4 ialah rangkaian lengkap empat varian terbukaDireka untuk pembangun, perniagaan dan entiti awam yang mahukan lebih banyak kawalan ke atas data dan penggunaan mereka, cadangan ini amat sesuai dengan keperluan Kedaulatan digital dan pematuhan peraturan di Eropahdi mana kuasa untuk menentukan di mana pelaksanaan dan di mana data disimpan menjadi semakin penting.
Sebuah keluarga empat model yang memberi tumpuan kepada "kecerdasan berasaskan parameter"
Gemma 4 telah dibina di atas asas teknologi yang sama seperti gemini 3Tetapi dengan objektif yang jelas: untuk memaksimumkan apa yang Google panggil "kecerdasan berasaskan parameter"Daripada bersaing semata-mata berdasarkan saiz, syarikat ini berbangga kerana telah mencapai tahap prestasi yang setanding dengan sistem yang jauh lebih besar dalam model yang agak padat.
Keluarga terdiri daripada empat saiz berbeza: Berkesan 2B (E2B), Berkesan 4B (E4B), satu model bagi 26B dengan seni bina Campuran Pakar (MoE) dan varian padat bagi Parameter 31BYang terakhir ini sudah terletak di 3 teratas dalam ranking Arena AI untuk model terbuka, mengatasi alternatif yang menggandakan bilangan parameternya dengan dua puluh, sesuatu yang amat relevan bagi mereka yang ingin mengurangkan kos GPU tanpa mengorbankan kualiti.
Model 26B MoE Ia dioptimumkan untuk mengaktifkan hanya sebahagian kecil daripada parameternya (sekitar 3,8B) dalam inferens, meningkatkan kelajuan penjanaan token dan kecekapan tenaga. Sebaliknya, versi 31B padat Ia diletakkan sebagai pilihan pilihan untuk tugasan penalaan halus yang mencabar, orkestrasi yang kompleks dan penggunaan intensif dalam persekitaran perniagaan atau institusi.
Google menekankan bahawa, dari segi penanda aras awam, varian ini bersaing secara langsung dengan model yang lebih berat daripada penyedia lain, termasuk model daripada pengeluar China seperti DeepSeek atau Qwen, yang sejak kebelakangan ini telah menjadi kukuh dalam ekosistem sumber terbuka. 31B Gemma 4 disenaraikan sebagai model terbuka ketiga terbaik dalam Arena AI, manakala KPM 26B juga berada di kedudukan yang tinggi.
Dari perspektif perniagaan, hubungan antara saiz dan prestasi membayangkan kurang perbelanjaan perkakasan, latensi yang lebih rendah dan keupayaan untuk menjalankan model sempadan dalam satu GPU NVIDIA H100 80GBIni membuka pintu untuk syarikat Eropah bersaiz sederhana untuk bekerjasama dengan AI canggih tanpa melabur dalam infrastruktur yang tidak seimbang.
AI bersaiz poket: mudah alih, IoT dan pengkomputeran pinggir
Model-model yang lebih kecil, E2B dan E4BIa direka bentuk khusus untuk beroperasi di pinggir rangkaian, iaitu, dalam peranti mudah alih, IoT dan perkakasan tempatanGoogle menyatakan bahawa varian ini dioptimumkan untuk dijalankan pada Telefon pintar Android, Raspberry PiJetson Nano dan sistem berkuasa rendah yang lain, dengan kependaman yang sangat rendah dan walaupun tanpa sambungan internet.
Dalam segmen ini, keutamaan bukan sekadar kuasa mentah, tetapi keupayaan untuk menawarkan fungsi multimodal dan tindak balas pantas dalam persekitaran yang terhad sumber. Model Gemma 4 edge boleh mengendalikan teks, imej dan video, dan dalam kes E2B dan E4B, mereka menambah sokongan asli untuk audioIni membolehkan kes penggunaan seperti pembantu suara tempatan, pengecaman imej medan atau analitik video masa nyata tanpa perlu menghantar data ke awan.
Tetingkap konteks untuk model ringan ini mencapai Token 128.000Ini mencukupi untuk memproses dokumen panjang, perbualan yang meluas atau coretan kod yang berkaitan dalam satu gesaan. Menurut Google, gabungan konteks yang luas dan pelaksanaan setempat ini membantu menghapuskan geseran. privasi, ketersambungan dan kependamanIni sangat relevan untuk projek perindustrian, penjagaan kesihatan atau pendidikan di Eropah, di mana sekatan ke atas pemprosesan data menjadi semakin ketat.
Dari perspektif pengeluar perkakasan, Gemma 4 membuka pintu kepada integrasi AI lanjutan terus ke dalam produk penggunaDaripada telefon pintar dan tablet kepada peranti perubatan dan sensor perindustrian, syarikat itu telah menekankan bahawa model-model ini direka bentuk untuk berfungsi dengan cip daripada penyedia ekosistem Android biasa, seperti Qualcomm dan MediaTek, sekali gus memudahkan penggunaannya secara meluas.
Tambahan pula, seni bina model pinggir memanfaatkan teknik seperti Benaman Setiap Lapisan (PLE) untuk memaksimumkan kecekapan penggunaan parameter, membolehkan penaakulan dan pemahaman konteks pada kos pengiraan yang jauh lebih rendah daripada biasa dalam model tujuan umum.
Multimodaliti, ejen dan sokongan pembangun lanjutan
Salah satu kekuatan Gemma 4 ialah komitmennya yang jelas terhadap aliran kerja agenModel-model ini tidak terhad kepada menjana teks: ia disepadukan secara asli pemanggilan fungsi, output JSON berstruktur dan arahan sistemIni membolehkan pembinaan ejen autonomi yang mengatur pelbagai langkah, memanggil API luaran dan mengembalikan hasil dalam format yang mudah disepadukan dengan aplikasi perusahaan.
Google menegaskan bahawa semua model dalam keluarga Gemma 4 telah direka bentuk sebagai penaakulan peringkat tinggidengan mod pemikiran yang boleh dikonfigurasikan untuk melaraskan kedalaman penaakulan mengikut tugasan. Ini diterjemahkan kepada hasil yang lebih baik dalam penaakulan berbilang peringkat, penjanaan kod luar talian dan penyelesaian masalah yang kompleks, aspek utama dalam persekitaran korporat dan pentadbiran awam yang memerlukan kebolehpercayaan.
Dalam satah multimodal, keempat-empat model boleh memproses Teks dan imej dengan resolusi dan nisbah aspek yang berbeza, manakala varian E2B dan E4B mengembangkan kapasiti tersebut kepada video dan audioGabungan ini membolehkan, sebagai contoh, sistem yang menganalisis dokumen dengan grafik, video pemantauan perindustrian atau kandungan pendidikan yang kaya dan menjana respons kontekstual dalam masa nyata.
Tetingkap konteks mencapai 256.000 token dalam model terbesarIni membolehkan pengguna memuat naik keseluruhan repositori kod, kontrak undang-undang yang panjang atau sejumlah besar dokumentasi teknikal dalam satu pertanyaan. Untuk pasukan sokongan, perundingan atau audit IT, ini memudahkan untuk mengautomasikan tugas yang sebelum ini memerlukan semakan manual selama berjam-jam.
Dari segi bahasa, Gemma 4 secara natif menyokong lebih daripada 140 bahasaBagi Eropah, dan khususnya untuk Sepanyol, ini bermakna penyelesaian berbilang bahasa boleh dibangunkan yang merangkumi segala-galanya daripada bahasa utama EU kepada bahasa yang kurang diwakili, membantu memenuhi matlamat kebolehcapaian dan inklusiviti dalam perkhidmatan awam dan swasta.
Integrasi awan, kedaulatan digital dan penggunaan di Eropah
Penggunaan Gemma 4 tidak terhad kepada perkakasan di premis. Google telah mengintegrasikan model ini ke dalam tawaran awannya melalui Verteks AI y Enjin Google Kubernetes (GKE)membolehkan organisasi mengkonfigurasi sumber pengkomputeran khusus dan menskala beban kerja inferens atas permintaan. Bagi sektor Eropah yang dikawal selia, ini digabungkan dengan pilihan untuk Awan Berdaulat dan penggunaan ruang udara atau di premis, diselaraskan dengan keperluan residensi data dan pematuhan dengan Peraturan Perlindungan Data Umum (GDPR).
Syarikat itu menekankan bahawa pemberat ketepatan bfloat16 bagi model yang lebih besar boleh dijalankan dengan cekap dalam GPU NVIDIA H100 80GB tunggalmengurangkan halangan kemasukan bagi syarikat bersaiz sederhana atau institusi awam yang ingin mengekalkan kawalan infrastruktur mereka. Dalam versi terkuantum, model juga boleh berfungsi dalam perkakasan atau stesen kerja pengguna, mengembangkan rangkaian kemungkinan penggunaan.
Bagi pengurus teknologi di Sepanyol dan seluruh Eropah, gabungan ini model terbuka, penggunaan terkawal dan sokongan awan berdaulat Ia membolehkan reka bentuk seni bina hibrid: sebahagian daripada kecerdasan boleh berada di pusat data tempatan, manakala beban kerja lain yang kurang sensitif dijalankan di awan awam, semuanya sambil mengekalkan asas teknologi yang sama.
Selain itu, Google menawarkan Kit Pembangunan Agen (ADK)Rangka kerja modular yang memudahkan penciptaan, pengujian dan penggunaan ejen berasaskan Gemma 4. Ia juga bergantung pada perkhidmatan seperti Cloud Run dengan GPU NVIDIA RTX PRO 6000 (Blackwell) dalam mod tanpa pelayan, yang membolehkan projek rintis berintensiti tinggi dilancarkan tanpa perlu memperoleh perkakasan anda sendiri dari hari pertama.
Dalam konteks Eropah di mana perdebatan mengenai AI biasanya berkisar tentang kawalan, ketelusan dan kebolehauditan, kemungkinan Gunakan model terbuka di bawah Apache 2.0 dalam infrastruktur terkawal Ia amat menarik bagi pentadbiran, bank, syarikat insurans atau syarikat dalam sektor kesihatan yang perlu menyelaraskan inovasi dengan rangka kerja kawal selia yang ketat.
Lesen Apache 2.0, ekosistem terbuka dan daya tarikan komuniti
Jika terdapat satu aspek yang telah menimbulkan minat tertentu dalam komuniti, ia adalah keputusan untuk melesenkan Gemma 4 di bawah Apache 2.0Versi Gemma sebelum ini menggunakan lesen tersuai yang menimbulkan persoalan undang-undang untuk produk komersial; kini, dengan lesen sumber terbuka standard, Pembangun dan syarikat boleh mengubah suai, mengagihkan semula dan menjana wang daripada model dengan geseran yang jauh lebih sedikit.
Pembukaan ini datang pada masa Google sedang cuba mendapatkan semula kedudukan dalam ekosistem model terbukaIni berlaku selepas tempoh di mana alternatif seperti Llama Meta atau model Cina (DeepSeek, Qwen, GLM, Minimax) telah mendapat kadar penerimaan. Suara berpengaruh dalam sektor ini, seperti pengasas bersama Hugging Face, telah menyifatkan langkah itu sebagai "pencapaian penting" untuk AI tempatan, menekankan bahawa pasukan perundangan kini mempunyai rangka kerja yang lebih jelas untuk meluluskan projek berdasarkan Gemma 4.
Ekosistem yang mengelilingi keluarga Gemma sudah menunjukkan kekuatan sebelum versi ini. Google menyatakan bahawa generasi sebelumnya melebihi... 400 juta muat turun dan bahawa komuniti telah mencipta lebih daripada 100.000 varian disesuaikan dengan bahasa dan kes penggunaan yang berbeza. Antara contoh yang paling menarik ialah model yang dikhususkan dalam Bulgaria atau alat penyelidikan kanser seperti Skala Ayat Sel2 dibangunkan di Universiti Yale.
Dengan Gemma 4, syarikat itu berharap "Gemmaverse" akan berkembang lebih jauh, menjemput... Syarikat baharu, universiti dan pusat penyelidikan Eropah untuk mencipta derivatif mereka sendiri. Gabungan lesen permisif dan pemberat terbuka membolehkan pembangunan versi yang tertumpu pada sektor tertentu, seperti penjagaan kesihatan, keadilan, Industri 4.0 atau pendidikan, yang kemudiannya boleh dikongsi atau dipasarkan tanpa terlalu banyak sekatan.
Bagi syarikat Sepanyol, situasi ini bermakna adalah mungkin untuk membina penyelesaian proprietari pada Gemma 4—seperti pembantu dalaman, enjin carian korporat atau sistem analitik lanjutan—sambil mengekalkan kawalan kod, data dan infrastruktur, sesuatu yang sesuai dengan trend pengukuhan kedaulatan teknologi Eropah.
Kes penggunaan: daripada syarikat baharu hingga syarikat besar
Gemma 4 telah dipersembahkan dengan pelbagai aplikasi yang berpotensiDalam dunia perniagaan, model boleh digunakan untuk mencipta pembantu maya berbilang bahasa mampu mengendalikan pertanyaan kompleks melalui penaakulan lanjutan, atau untuk mengautomasikan penjanaan dan semakan kod dalam pasukan pembangunan.
Model yang lebih besar ditujukan kepada tugas-tugas seperti pengaturan ejen, analisis sejumlah besar dokumentasiIni termasuk menjana laporan teknikal atau membantu jabatan perundangan dan pematuhan. Gabungan tetingkap konteks yang luas dan sokongan multimodal memudahkan ejen tunggal untuk mengendalikan kontrak, e-mel, carta, memantau imej sistem dan rakaman audio, semuanya dalam aliran kerja yang sama.
Dalam pendidikan dan sektor awam, keupayaan untuk memproses teks, imej, dan dalam beberapa kes video dan audio, membolehkan penciptaan platform sokongan pembelajaran yang menghasilkan ringkasan, penjelasan langkah demi langkah atau bahan yang disesuaikan dengan tahap yang berbeza. Pelaksanaan tempatan juga membantu menghormati keperluan privasi apabila bekerja dengan data sensitif kanak-kanak bawah umur atau kumpulan terdedah.
Dalam arena permulaan, Gemma 4 boleh menjadi asas kepada produk menegak Dalam fintech, kesihatan digital, logistik atau SaaS B2B, hasil daripada fleksibiliti yang ditawarkan oleh Apache 2.0, pasukan boleh melakukan penalaan halus model pada data mereka sendiri, menggunakannya di premis atau di awan dan memasarkan hasilnya tanpa terikat dengan lesen proprietari yang ketat.
Amat menarik bagi Eropah ialah kemungkinan untuk membangunkan penyelesaian AI tempatan yang menghormati peraturan kebangsaan dan komuniti, contohnya, dengan menyimpan data di pusat data yang terletak di wilayah Eropah dan memastikan model berada di bawah kawalan langsung organisasi, yang mungkin penting untuk projek yang berkaitan dengan Peraturan AI EU pada masa hadapan.
Di mana dan bagaimana untuk mengakses Gemma 4
Google telah menyediakan pemberat Gemma 4 melalui pelbagai saluran untuk memudahkan penggunaannya oleh pembangun dan penyelidik. Pemberat terbuka boleh dimuat turun dari Memeluk Muka y GitHub, manakala penggunaan melalui antara muka dan API tersedia dalam Google AI StudioIntegrasi juga ditawarkan dengan OllamaDocker, Kaggle dan alatan seperti LM Studio.
Menurut syarikat itu, Gemma 4 boleh dijalankan secara tempatan pada «berbilion peranti Android» dan merentasi pelbagai perkakasan: daripada GPU komputer riba dan stesen kerja, sehinggalah kepada pemecut pembangun khusus. Ini sejajar dengan strategi untuk memperluaskan AI termaju melangkaui pusat data yang besar, ke dalam peranti pengguna akhir dan persekitaran pengkomputeran pinggir.
Bagi mereka yang ingin bermula dengan ujian pantas, pilihan paling langsung adalah dengan menggunakan Google AI Studio untuk model 26B dan 31B atau Galeri Google AI Edge dalam kes varian E2B dan E4B. Secara selari, komuniti pembangun di platform seperti Hugging Face telah pun menerbitkan adaptasi dan konfigurasi sedia untuk digunakan untuk persekitaran yang berbeza.
Di Sepanyol dan negara-negara Eropah yang lain, dijangkakan penyepadu tempatan dan penyedia perkhidmatan terurus akan mula menawarkan penyelesaian siap guna berdasarkan Gemma 4, menggabungkan penggunaan awan berdaulat, sokongan dalam bahasa Sepanyol dan penyesuaian kepada peraturan sektor tertentu, seperti perkhidmatan kewangan atau penjagaan kesihatan.
Secara keseluruhannya, pelancaran Gemma 4 meletakkan Google sebagai salah satu pemain paling relevan dalam bidang model AI terbuka dan boleh dilaksanakan secara setempatIni berlaku pada masa industri Eropah menuntut alat yang menggabungkan prestasi tinggi, kawalan data dan rangka kerja pelesenan yang jelas untuk membina produk komersial jangka panjang.



