Gemini API תומך ביצירת תמונות באמצעות Gemini 2.0 Flash Experimental וגם באמצעות Imagen 3. המדריך הזה יעזור לכם להתחיל לעבוד עם שני המודלים.
הנחיות לכתיבת הנחיות לתמונות מפורטות בקטע המדריך לכתיבת הנחיות ל-Imagen.
לפני שמתחילים
לפני שמפעילים את Gemini API, צריך לוודא שה-SDK שבחרתם מותקן ושהגדרתם מפתח Gemini API מוכן לשימוש.
יצירת תמונות באמצעות Gemini
המודל הניסיוני 2.0 Flash Experimental תומך באפשרות להפיק טקסט ותמונות בתוך הטקסט. כך תוכלו להשתמש ב-Gemini כדי לערוך תמונות בשיחה או ליצור תוכן עם טקסט שמשולב בתמונות (לדוגמה, ליצור פוסט בבלוג עם טקסט ותמונות בפנייה אחת). כל התמונות שנוצרו כוללות סימן מים של SynthID, וגם תמונות ב-Google AI Studio כוללות סימן מים גלוי.
בדוגמה הבאה מוסבר איך להשתמש ב-Gemini 2.0 כדי ליצור פלט של טקסט ותמונה:
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64
client = genai.Client()
contents = ('Hi, can you create a 3d rendered image of a pig '
'with wings and a top hat flying over a happy '
'futuristic scifi city with lots of greenery?')
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=contents,
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO((part.inline_data.data)))
image.save('gemini-native-image.png')
image.show()
JavaScript
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const contents =
"Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?";
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
REST
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
]
}],
"generationConfig":{"responseModalities":["TEXT","IMAGE"]}
}' \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-native-image.png

בהתאם להנחיה ולהקשר, Gemini תיצור תוכן במצבים שונים (טקסט לתמונה, טקסט לתמונה וטקסט וכו'). הנה כמה דוגמאות:
- טקסט לתמונה
- דוגמה להנחיה: "יצירת תמונה של מגדל אייפל עם זיקוקים ברקע".
- טקסט לתמונות וטקסט (מקובץ)
- הנחיה לדוגמה: "יצירת מתכון מאויר לפאייה".
- תמונות וטקסט לתמונות וטקסט (משולבים)
- הנחיה לדוגמה: (עם תמונה של חדר מעוצב) "איזה ספות בצבע אחר יתאימו למרחב שלי? יש לך אפשרות לעדכן את התמונה?"
- עריכת תמונות (טקסט ותמונה לתמונה)
- הנחיה לדוגמה: "עריכת התמונה הזו כך שתראה כמו קריקטורה"
- דוגמה להנחיה: [image of a cat] + [image of a pillow] + "Create a cross stitch of my cat on this pillow".
- עריכת תמונות במספר שלבים (צ'אט)
- הנחיות לדוגמה: [upload an image of a blue car.] "Turn this car into a convertible" "עכשיו משנים את הצבע לצהוב".
עריכת תמונות באמצעות Gemini
כדי לערוך תמונה, מוסיפים תמונה כקלט. בדוגמה הבאה מוסבר איך מעלים תמונות בקידוד base64. כדי לשלוח כמה תמונות ועומסי נתונים גדולים יותר, אפשר לעיין בקטע הזנת תמונה.
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import PIL.Image
image = PIL.Image.open('/path/to/image.png')
client = genai.Client()
text_input = ('Hi, This is a picture of me.'
'Can you add a llama next to me?',)
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=[text_input, image],
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.show()
JavaScript
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
// Load the image from the local file system
const imagePath = "path/to/image.png";
const imageData = fs.readFileSync(imagePath);
const base64Image = imageData.toString("base64");
// Prepare the content parts
const contents = [
{ text: "Can you add a llama next to the image?" },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
];
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
REST
IMG_PATH=/path/to/your/image1.jpeg
if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
B64FLAGS="--input"
else
B64FLAGS="-w0"
fi
IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d "{
\"contents\": [{
\"parts\":[
{\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
{
\"inline_data\": {
\"mime_type\":\"image/jpeg\",
\"data\": \"$IMG_BASE64\"
}
}
]
}],
\"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
}" \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-edited-image.png
מגבלות
- כדי להשיג את הביצועים הטובים ביותר, מומלץ להשתמש בשפות הבאות: EN, es-MX, ja-JP, zh-CN, hi-IN.
- יצירת תמונות לא תומכת בקלט של אודיו או וידאו.
- יכול להיות שיצירת התמונות לא תמיד תגרום לפעולות הבאות:
- המודל יכול להפיק פלט של טקסט בלבד. נסו לבקש פלט של תמונות באופן מפורש (למשל, 'יצירת תמונה', 'הוספת תמונות תוך כדי עבודה', 'עדכון התמונה').
- יכול להיות שהמודל יפסיק ליצור תמונות באמצע התהליך. אפשר לנסות שוב או לנסות הנחיה אחרת.
- כשאתם יוצרים טקסט לתמונה, הכי טוב ליצור קודם את הטקסט ואז לבקש תמונה עם הטקסט.
בחירת דגם
באיזה מודל כדאי להשתמש כדי ליצור תמונות? זה תלוי בתרחיש לדוגמה.
Gemini 2.0 מתאים במיוחד ליצירת תמונות רלוונטיות לפי הקשר, למיזוג של טקסט ותמונות, לשילוב של ידע על העולם ולשימוש בתבונה לצורך ניתוח תמונות. אפשר להשתמש בה כדי ליצור רכיבים חזותיים מדויקים ורלוונטיים להקשר, שמוטמעים ברצפי טקסט ארוכים. אפשר גם לערוך תמונות בצורה שיחה, באמצעות שפה טבעית, תוך שמירה על ההקשר לאורך השיחה.
אם איכות התמונה היא העדיפות העליונה שלכם, Imagen 3 הוא הפתרון המתאים. Imagen 3 מצטיין ביצירת תמונות ריאליסטיות, פרטים אמנותיים וסגנונות אמנותיים ספציפיים כמו אימפרסיוניזם או אנימה. Imagen 3 הוא גם בחירה טובה למשימות מיוחדות של עריכת תמונות, כמו עדכון הרקעים של מוצרים, התאמת התמונות לרזולוציה גבוהה יותר והוספת מיתוג וסגנון לרכיבים חזותיים. אתם יכולים להשתמש ב-Imagen 3 כדי ליצור סמלי לוגו או עיצובים אחרים של מוצרים ממותגים.
יצירת תמונות באמצעות Imagen 3
Gemini API מספק גישה ל-Imagen 3, המודל האיכותי ביותר של Google ליצירת תמונות לפי טקסט, שכולל כמה יכולות חדשות ומשופרות. אפשר לבצע את הפעולות הבאות באמצעות Imagen 3:
- יצירת תמונות עם פרטים טובים יותר, תאורה עשירה יותר ופחות 'פגמים' מפריעים בהשוואה למודלים קודמים
- הסבר על הנחיות שנכתבות בשפה טבעית
- יצירת תמונות במגוון רחב של פורמטים וסגנונות
- רינדור טקסט בצורה יעילה יותר מאשר במודלים קודמים
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
JavaScript
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const response = await ai.models.generateImages({
model: 'imagen-3.0-generate-002',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
REST
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

בשלב הזה, Imagen תומך בהנחיות באנגלית בלבד ובפרמטרים הבאים:
הפרמטרים של מודל Imagen
(כללי השמות משתנים בהתאם לשפת התכנות).
numberOfImages
: מספר התמונות שייווצרו, מ-1 עד 4 (כולל). ערך ברירת המחדל הוא 4.aspectRatio
: שינוי יחס הגובה-רוחב של התמונה שנוצרת. הערכים הנתמכים הם"1:1"
,"3:4"
,"4:3"
,"9:16"
ו-"16:9"
. ערך ברירת המחדל הוא"1:1"
.personGeneration
: מתן הרשאה לדגם ליצור תמונות של אנשים. יש תמיכה בערכים הבאים:"DONT_ALLOW"
: חסימה של יצירת תמונות של אנשים."ALLOW_ADULT"
: יצירת תמונות של מבוגרים, אבל לא של ילדים. זוהי ברירת המחדל.
מדריך להנחיות ב-Imagen
בקטע הזה במדריך של Imagen מוסבר איך שינוי של הנחיה להמרת טקסט לתמונה יכול להניב תוצאות שונות, ומוצגות דוגמאות לתמונות שאפשר ליצור.
יסודות לכתיבת הנחיות
הנחיה טובה היא תיאורית וברורה, ומכילה מילות מפתח ומשתני שינוי משמעותיים. קודם כול, כדאי לחשוב על הנושא, ההקשר והסגנון.

נושא: הדבר הראשון שצריך לחשוב עליו בכל הנחיה הוא הנושא: האובייקט, האדם, החיה או הנוף שרוצים לצלם.
הקשר ורקע: חשוב לא פחות הוא הרקע או ההקשר שבהם הנושא יוצג. נסו למקם את מושא הצילום במגוון סביבות. לדוגמה, סטודיו עם רקע לבן, סביבה חיצונית או פנימית.
סגנון: לסיום, מוסיפים את סגנון התמונה הרצוי. הסגנונות יכולים להיות כלליים (ציור, צילום, סקיצות) או ספציפיים מאוד (ציור בפסטל, ציור בפחם, איזומטרי תלת-ממדי). אפשר גם לשלב סגנונות.
אחרי שכותבים גרסה ראשונה של ההנחיה, מוסיפים פרטים נוספים כדי לשפר אותה עד שמגיעים לתמונה הרצויה. חשוב לבצע איטרציות. מתחילים ביצירת הרעיון המרכזי, ואז משכללים ומרחיבים אותו עד שהתמונה שנוצרת קרובה לחזון שלכם.
![]() |
![]() |
![]() |
Imagen 3 יכול להפוך את הרעיונות שלכם לתמונות מפורטות, גם אם ההנחיות שלכם קצרות וגם אם הן ארוכות ומפורטות. תוכלו לשפר את התוצאה באמצעות הנחיות חוזרות, ולהוסיף פרטים עד שתגיעו לתוצאה המושלמת.
הנחיות קצרות מאפשרות לכם ליצור תמונה במהירות. ![]() |
הנחיות ארוכות יותר מאפשרות לכם להוסיף פרטים ספציפיים ולבנות את התמונה. ![]() |
טיפים נוספים לכתיבת הנחיות ב-Imagen:
- שימוש בשפה תיאורית: כדאי להשתמש בתיאורים מפורטים של תארים ותווית תיאור כדי לתאר תמונה ברורה ב-Imagen 3.
- הוספת הקשר: אם צריך, מוסיפים מידע רקע כדי לעזור ל-AI להבין את התוכן.
- הפניה לאומנים או לסגנונות ספציפיים: אם יש לכם חזון אסתטי מסוים, כדאי להיעזר באומנים או בתנועות אמנותיות ספציפיים.
- שימוש בכלים להנדסת הנחיות: כדאי לבדוק את הכלים או המשאבים להנדסת הנחיות שיעזרו לכם לשפר את ההנחיות ולהגיע לתוצאות אופטימליות.
- שיפור פרטי הפנים בתמונות האישיות והקבוצתיות:
- לציין פרטים של הפנים כמוקדי התמונה (לדוגמה, להשתמש במילה 'דיוקן' בהנחיה).
יצירת טקסט בתמונות
בעזרת Imagen אפשר להוסיף טקסט לתמונות, וכך לקבל אפשרויות יצירת תמונות יצירתיות יותר. כדי להפיק את המקסימום מהתכונה הזו, מומלץ לפעול לפי ההנחיות הבאות:
- חזרה על תהליך היצירה בביטחון: יכול להיות שתצטרכו ליצור מחדש את התמונות עד שתגיעו למראה הרצוי. שילוב הטקסט ב-Imagen עדיין מתפתח, ולפעמים כמה ניסיונות מניב את התוצאות הטובות ביותר.
- קצר וקולע: כדי שהיצירה תהיה אופטימלית, כדאי להגביל את הטקסט ל-25 תווים או פחות.
כמה ביטויים: כדאי לנסות להשתמש בשני או שלושה ביטויים נפרדים כדי לספק מידע נוסף. כדי ליצור קומפוזיציות נקיות יותר, מומלץ להימנע משימוש ביותר משלושה ביטויים.
הנחיה: פוסטרים עם הטקסט 'Summerland' בגופן מודגש בתור כותרת, מתחת לטקסט הזה מופיע הסלוגן 'Summer never felt so good' הנחיה למיקום: מערכת Imagen יכולה לנסות למקם את הטקסט לפי ההוראות, אבל יכול להיות שתבחינו בפעמים מסוימות בתנודות. אנחנו כל הזמן משפרים את התכונה הזו.
השפעה על סגנון הגופן: אפשר לציין סגנון גופן כללי כדי להשפיע בעדינות על הבחירות של Imagen. אל תצפו לשכפול מדויק של הגופן, אלא לפרשנויות יצירתיות.
גודל גופן: מציינים גודל גופן או אינדיקציה כללית לגודל (לדוגמה, קטן, בינוני, גדול) כדי להשפיע על יצירת גודל הגופן.
הגדרת פרמטרים להנחיה
כדי לשלוט טוב יותר בתוצאות הפלט, מומלץ להגדיר פרמטרים של הקלט ב-Imagen. לדוגמה, נניח שאתם רוצים לאפשר ללקוחות ליצור סמלי לוגו לעסק שלהם, ואתם רוצים לוודא שהסמלים תמיד נוצרים על רקע בצבע אחיד. בנוסף, אתם רוצים להגביל את האפשרויות שהלקוח יכול לבחור בתפריט.
בדוגמה הזו אפשר ליצור הנחיה עם פרמטרים, בדומה לדוגמה הבאה:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.
בממשק המשתמש המותאם אישית, הלקוח יכול להזין את הפרמטרים באמצעות תפריט, והערך שבחר מאכלס את ההנחיה ש-Imagen מקבלת.
לדוגמה:
הנחיה:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
הנחיה:
A modern logo for a software company on a solid color background. Include the text Silo.
הנחיה:
A traditional logo for a baking company on a solid color background. Include the text Seed.
שיטות מתקדמות לכתיבת הנחיות
תוכלו להיעזר בדוגמאות הבאות כדי ליצור הנחיות ספציפיות יותר על סמך מאפיינים כמו תיאורים של צילומי סטילס, צורות וחומרים, תנועות היסטוריות באמנות ומאפייני שינוי של איכות התמונה.
צילום
- ההנחיה כוללת: "תמונה של..."
כדי להשתמש בסגנון הזה, כדאי להתחיל להשתמש במילות מפתח שמציינות בבירור ל-Imagen שאתם מחפשים תמונה. נותנים הנחיות שמתחילות ב-"תמונה של. . ." לדוגמה:
![]() |
![]() |
![]() |
מקור התמונה: כל תמונה נוצרה באמצעות ההנחיה הטקסטואלית התואמת שלה באמצעות מודל Imagen 3.
אביזרי צילום
בדוגמאות הבאות אפשר לראות כמה פרמטרים ומשתני אופן פעולה ספציפיים לצילום. אפשר לשלב כמה משתני אופן פעולה כדי לקבל שליטה מדויקת יותר.
קרבה למצלמה – צילום תקריב, שצולם מרחוק
הנחיה: תמונה מקרוב של פולי קפה הנחיה: תמונה לא מוגדלת של שקית קטנה של
פולי קפה במטבח מבולגןמיקום המצלמה – אווירי, מלמטה
הנחיה: תמונה אווירית של עיר עירונית עם גורדי שחקים הנחיה: תמונה של צלע יער עם שמיים כחולים מלמטה תאורה – טבעית, דרמטית, חמה, קרה
הנחיה: תמונה בסטודיו של כורסה מודרנית, תאורה טבעית הנחיה: תמונה בסטודיו של כורסה מודרנית, תאורה דרמטית הגדרות המצלמה - טשטוש תנועה, מיקוד רך, בוקה, דיוקן
הנחיה: תמונה של עיר עם גורדי שחקים מתוך רכב עם טשטוש תנועה הנחיה: תמונה עם מיקוד רך של גשר בעיר עירונית בלילה סוגי עדשות – 35 מ"מ, 50 מ"מ, עדשת עין הדג, עדשת זווית רחבה, עדשת מאקרו
הנחיה: תמונה של עלה, עדשת מאקרו הנחיה: צילום רחוב, ניו יורק, עדשת עין הדג סוגי סרטים – שחור-לבן, פולרואיד
הנחיה: דיוקן פולרואיד של כלב עם משקפי שמש הנחיה: תמונה בשחור-לבן של כלב עם משקפי שמש
מקור התמונה: כל תמונה נוצרה באמצעות ההנחיה הטקסטואלית התואמת שלה באמצעות מודל Imagen 3.
איור ואומנות
- ההנחיה כוללת: "painting של...", 'sketch של…'
סגנונות האמנות משתנים מסגנונות מונוכרום כמו סקיצות בעיפרון ועד אומנות דיגיטלית היפר-ריאליסטית. לדוגמה, בתמונות הבאות נעשה שימוש באותה הנחיה עם סגנונות שונים:
"[art style or creation technique] של מכונית סדאן ספורטיבית חשמלית עם גורדי שחקים ברקע"
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
מקור התמונות: כל תמונה נוצרה באמצעות ההנחיה הטקסטואלית התואמת שלה באמצעות מודל Imagen 2.
צורות וחומרים
- ההנחיה כוללת: "...עשוי מ...", '…בצורה של…'
אחד מהיתרונות של הטכנולוגיה הזו הוא שאפשר ליצור תמונות שקשה או בלתי אפשרי ליצור אותן בדרכים אחרות. לדוגמה, תוכלו ליצור מחדש את הלוגו של החברה בחומרים ובמרקמים שונים.
![]() |
![]() |
![]() |
מקור התמונה: כל תמונה נוצרה באמצעות ההנחיה הטקסטואלית התואמת שלה באמצעות מודל Imagen 3.
מקורות היסטוריים לאמנות
- ההנחיה כוללת: "…בסגנון של…"
סגנונות מסוימים הפכו לאיקונים במשך השנים. ריכזנו כאן כמה רעיונות לציור היסטורי או לסגנונות אמנות היסטוריים שתוכלו לנסות.
"generate an image in the style of [art period or movement] : a wind farm"
![]() |
![]() |
![]() |
מקור התמונה: כל תמונה נוצרה באמצעות ההנחיה הטקסטואלית התואמת שלה באמצעות מודל Imagen 3.
משתני איכות תמונה
מילות מפתח מסוימות יכולות להעביר למנוע החיפוש את המסר שאתם מחפשים נכס באיכות גבוהה. דוגמאות למשתני איכות:
- תוספי הגדרה כלליים – באיכות גבוהה, יפים, בסגנון
- תמונות – 4K, HDR, Studio Photo
- אמנות, איור – מקצועי ומפורט
בהמשך מפורטות כמה דוגמאות להנחיות ללא משתני איכות, ואותה הנחייה עם משתני איכות.
![]() |
![]() של גבעול תירס שצולמה על ידי צלם מקצועי |
מקור התמונה: כל תמונה נוצרה באמצעות ההנחיה הטקסטואלית התואמת שלה באמצעות מודל Imagen 3.
יחסי גובה-רוחב
יצירת תמונות באמצעות Imagen 3 מאפשרת להגדיר חמישה יחסי גובה-רוחב שונים של תמונות.
- ריבוע (1:1, ברירת המחדל) – תמונה ריבועית רגילה. יחס גובה-רוחב נפוץ נוסף הוא 1:1. הוא מתאים לפוסטים ברשתות חברתיות.
מסך מלא (4:3) – יחס הגובה-רוחב הזה נפוץ בתקשורת או בסרטים. אלה גם המידות של רוב הטלוויזיות הישנות (לא מסך רחב) ומצלמות בפורמט בינוני. ביחס גובה-רוחב כזה אפשר לצלם יותר מהסצנה (בהשוואה ליחס גובה-רוחב של 1:1), ולכן זהו יחס הגובה-רוחב המועדף לצילום.
הנחיה: תקריב על אצבעות של מוזיקאי שמנגן בפסנתר, סרט בשחור לבן, וינטג'י (יחס גובה-רוחב 4:3) הנחיה: תמונה מקצועית בסטודיו של צ'יפס למסעדה יוקרתית, בסגנון של מגזין אוכל (יחס גובה-רוחב של 4:3) מסך מלא לאורך (3:4) – זהו יחס הגובה-רוחב של המסך המלא, לאחר סיבוב של 90 מעלות. כך אפשר לצלם יותר מהסצנה אנכית בהשוואה ליחס גובה-רוחב של 1:1.
הנחיה: אישה בטיול, תקריב של המגפיים שלה שמשקפים בתוך שלולית, הרים גדולים ברקע, בסגנון של מודעה, זוויות דרמטיות (יחס גובה-רוחב של 3:4) הנחיה: תמונה אווירית של נהר שזורם במעלה עמק מסתורי (יחס גובה-רוחב 3:4) מסך רחב (16:9) – היחס הזה החליף את היחס 4:3 והוא עכשיו יחס הגובה-רוחב הנפוץ ביותר בטלוויזיות, במסכים ובמסכי טלפונים ניידים (לרוחב). כדאי להשתמש ביחס גובה-רוחב כזה כשרוצים לצלם יותר מהרקע (לדוגמה, נופים).
הנחיה: גבר לבוש לבן יושב על החוף, תקריב, תאורה בשעת הזהב (יחס גובה-רוחב 16:9) לאורך (9:16) – יחס גובה-רוחב של מסך רחב, אבל מסובב. זהו יחס גובה-רוחב חדש יחסית שנעשה פופולרי באפליקציות של סרטונים קצרים (לדוגמה, YouTube Shorts). משתמשים באפשרות הזו עבור אובייקטים גבוהים עם כיוון אנכי בולט, כמו בניינים, עצים, מפלים או אובייקטים דומים אחרים.
הנחיה: עיבוד דיגיטלי של גורד שחקים עצום, מודרני, מפואר ואפי, עם שקיעה יפה ברקע (יחס גובה-רוחב 9:16)
תמונות פוטוריאליסטיות
גרסאות שונות של מודל יצירת התמונות עשויות להציע שילוב של פלט אמנותי ופלט פוטו-ריאליסטי. כדי ליצור פלט ריאליסטי יותר על סמך הנושא שרוצים ליצור, כדאי להשתמש בניסוח הבא בהנחיות.
תרחיש לדוגמה | סוג העדשה | אורכי מוקד | פרטים נוספים |
---|---|---|---|
אנשים (דיוקנאות) | Prime, zoom | 24-35 מ״מ | סרט בשחור-לבן, סרט נואר, עומק שדה, דו-גוני (ציינו שני צבעים) |
אוכל, חרקים, צמחים (אובייקטים, טבע דומם) | Macro | 60-105 מ״מ | רמת פירוט גבוהה, מיקוד מדויק, תאורה מבוקרת |
ספורט, חיות בר (תנועה) | זום טלפוטו | 100-400 מ״מ | מהירות תריס מהירה, מעקב אחר תנועה או פעולה |
אסטרונומי, לרוחב (רחב-זווית) | זווית רחבה | 10-24 מ״מ | זמני חשיפה ארוכים, מיקוד חד, חשיפה ארוכה, מים או עננים חלקים |
צילומי פורטרט
תרחיש לדוגמה | סוג העדשה | אורכי מוקד | פרטים נוספים |
---|---|---|---|
אנשים (דיוקנאות) | Prime, zoom | 24-35 מ״מ | סרט שחור-לבן, סרט נואר, עומק שדה, דו-גוני (ציינו שני צבעים) |
בעזרת כמה מילות מפתח מהטבלה, Imagen יכול ליצור את הדיוקנאות הבאים:
![]() |
![]() |
![]() |
![]() |
הנחיה: אישה, דיוקן 35 מ"מ, דו-גווני כחול ואפור
דגם: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
הנחיה: אישה, פורטרט בפורמט 35 מ"מ, סרט שחור-לבן
דגם: imagen-3.0-generate-002
אובייקטים
תרחיש לדוגמה | סוג העדשה | אורכי מוקד | פרטים נוספים |
---|---|---|---|
אוכל, חרקים, צמחים (אובייקטים, טבע דומם) | Macro | 60-105 מ״מ | רמת פירוט גבוהה, מיקוד מדויק, תאורה מבוקרת |
בעזרת כמה מילות מפתח מהטבלה, Imagen יכול ליצור את תמונות האובייקטים הבאות:
![]() |
![]() |
![]() |
![]() |
הנחיה: עלה של צמח תפילה, עדשת מאקרו, 60 מ"מ
דגם: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
הנחיה: צלחת פסטה, עדשת מאקרו 100 מ"מ
דגם: imagen-3.0-generate-002
תנועה
תרחיש לדוגמה | סוג העדשה | אורכי מוקד | פרטים נוספים |
---|---|---|---|
ספורט, חיות בר (תנועה) | זום טלפוטו | 100-400 מ״מ | מהירות תריס מהירה, מעקב אחר פעולה או תנועה |
בעזרת כמה מילות מפתח מהטבלה, Imagen יכול ליצור את קובצי ה-GIF הבאים:
![]() |
![]() |
![]() |
![]() |
הנחיה: טאצ'דאון מנצח, מהירות תריס מהירה, מעקב אחר תנועה
דגם: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
הנחיה: צבי שרץ ביער, מהירות תריס מהירה, מעקב אחר תנועה
דגם: imagen-3.0-generate-002
זווית רחבה
תרחיש לדוגמה | סוג העדשה | אורכי מוקד | פרטים נוספים |
---|---|---|---|
אסטרונומי, לרוחב (רחב-זווית) | זווית רחבה | 10-24 מ״מ | זמני חשיפה ארוכים, מיקוד חד, חשיפה ארוכה, מים או עננים חלקים |
בעזרת כמה מילות מפתח מהטבלה, Imagen יכול ליצור את התמונות הרחבות הבאות:
![]() |
![]() |
![]() |
![]() |
הנחיה: רכס הרים רחב ידיים, זווית רחבה 10mm, פריסה לרוחב
דגם: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
הנחיה: תמונה של הירח, צילום אסטרונומי, זווית רחבה 10mm
דגם: imagen-3.0-generate-002
המאמרים הבאים
- במדריך Veo מוסבר איך ליצור סרטונים באמצעות Gemini API.
- למידע נוסף על מודלים של Gemini 2.0, אפשר לעיין במאמרים מודלים של Gemini ומודלים ניסיוניים.