Dokumen ini menjelaskan cara men-deploy model Hugging Face yang didukung di Vertex AI dan Google Kubernetes Engine, serta mencakup topik berikut: Hugging Face menyediakan model terlatih, skrip penyesuaian, dan API pengembangan yang mempermudah pembuatan dan penemuan LLM. Model Garden dapat menayangkan model Text Embeddings, Text To Image, Text Generation, dan Image Text To Text dari Hugging Face. Diagram berikut merangkum alur kerja untuk men-deploy model Hugging Face dari Model Garden: Anda dapat men-deploy model Hugging Face yang didukung di Vertex AI atau Google Kubernetes Engine (GKE). Pilihan opsi deployment Anda bergantung pada model yang Anda gunakan dan tingkat kontrol yang Anda perlukan untuk workload Anda. Vertex AI menawarkan platform terkelola untuk membangun dan menskalakan project machine learning tanpa memerlukan keahlian MLOps internal. Anda dapat menggunakan Vertex AI sebagai aplikasi hilir yang menyajikan model Hugging Face. Pertimbangkan untuk menggunakan Vertex AI jika Anda menginginkan kemampuan MLOps end-to-end, fitur ML bernilai tambah, dan pengalaman serverless untuk pengembangan yang lancar. Untuk men-deploy model Hugging Face yang didukung di Vertex AI: Buka Model Garden. Di bagian Open models on Hugging Face, klik Show more. Temukan dan pilih model yang akan di-deploy. Opsional: Untuk Deployment environment, pilih Vertex AI. Opsional: Tentukan detail deployment. Klik Deploy. Untuk memulai, lihat contoh berikut: Google Kubernetes Engine (GKE) adalah Google Cloud solusi untuk Kubernetes terkelola yang memberikan skalabilitas, keamanan, ketahanan, dan efektivitas biaya. Opsi ini direkomendasikan jika Anda telah berinvestasi di Kubernetes, organisasi Anda memiliki keahlian MLOps internal, atau jika Anda memerlukan kontrol terperinci atas workload AI/ML yang kompleks dengan persyaratan keamanan, pipeline data, dan pengelolaan resource yang unik. Untuk men-deploy model Hugging Face yang didukung di GKE: Buka Model Garden. Di bagian Open models on Hugging Face, klik Show more. Temukan dan pilih model yang akan di-deploy. Untuk Deployment environment, pilih GKE. Ikuti petunjuk deployment. Untuk memulai, lihat contoh berikut: Model Hugging Face terbaru dan paling populer otomatis ditambahkan ke Model Garden. Proses ini mencakup pembuatan otomatis konfigurasi deployment untuk setiap model. Untuk mengatasi kekhawatiran tentang kerentanan dan kode berbahaya, Vertex AI menggunakan Hugging Face Malware Scanner untuk menilai keamanan file dalam setiap repositori model Hugging Face setiap hari. Jika repositori model ditandai berisi malware, Vertex AI akan segera menghapus model dari halaman galeri Hugging Face. Meskipun model yang ditetapkan sebagai didukung oleh Vertex AI telah menjalani pengujian dan dapat di-deploy di Vertex AI, penetapan ini tidak menjamin tidak adanya kerentanan atau kode berbahaya. Sebelum men-deploy model apa pun di lingkungan produksi, lakukan verifikasi keamanan Anda sendiri. Konfigurasi deployment default yang disediakan dengan opsi deployment sekali klik mungkin tidak memenuhi setiap persyaratan, karena beragamnya kasus penggunaan dan perbedaan prioritas untuk latensi, throughput, biaya, dan akurasi. Anda dapat bereksperimen dengan deployment sekali klik untuk membuat tolok ukur, lalu menyesuaikan konfigurasi deployment menggunakan notebook Colab atau Python SDK. Pendekatan berulang ini memungkinkan Anda menyesuaikan deployment dengan kebutuhan yang tepat dan mencapai performa terbaik untuk aplikasi tertentu. Untuk mengetahui informasi selengkapnya, lihat notebook berikut: Jika model yang Anda butuhkan tidak tercantum di Model Garden, berarti model tersebut tidak didukung secara langsung. Bagian ini menjelaskan alasan model mungkin tidak tercantum dan tindakan yang dapat Anda lakukan. Model mungkin tidak ada di Model Garden karena alasan berikut: Jika model tidak tersedia di Model Garden, Anda memiliki opsi berikut:
Opsi deployment untuk model Hugging Face
Opsi Deployment Deskripsi Paling cocok untuk... Vertex AI Platform serverless terkelola untuk membangun dan menskalakan project machine learning. Tim yang menginginkan kemampuan MLOps end-to-end dan pengalaman pengembangan yang disederhanakan tanpa memerlukan keahlian MLOps internal. GKE Layanan Kubernetes terkelola yang memberikan skalabilitas, keamanan, dan ketahanan. Organisasi yang telah berinvestasi di Kubernetes, memiliki keahlian MLOps internal, atau yang memerlukan kontrol terperinci atas beban kerja AI/ML yang kompleks. Men-deploy di Vertex AI
Men-deploy di GKE
Arti "Didukung oleh Vertex AI"
Menyesuaikan konfigurasi deployment untuk kasus penggunaan tertentu
Yang harus dilakukan jika model tidak ada di Model Garden
Alasan model mungkin tidak tercantum
text-generation
dan image-text-to-text
.text-generation
, text2text-generation
, text-to-image
, feature-extraction
, sentence-similarity
, dan image-text-to-text
.Yang dapat Anda lakukan
Menggunakan Model Hugging Face
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-08-19 UTC.