Gemini API 코드 실행 기능을 사용하면 모델이 Python 코드를 생성 및 실행하고 최종 출력에 도달할 때까지 결과에서 반복적으로 학습할 수 있습니다. 이 코드 실행 기능을 사용하면 코드 기반 추론의 이점을 활용하며 텍스트 출력을 생성하는 애플리케이션을 빌드할 수 있습니다. 예를 들어 방정식을 풀거나 텍스트를 처리하는 애플리케이션에서 코드 실행을 사용할 수 있습니다.
코드 실행은 AI Studio와 Gemini API 모두에서 사용할 수 있습니다. AI Studio의 도구 아래 오른쪽 패널에서 코드 실행을 사용 설정할 수 있습니다. Gemini API는 함수 호출과 마찬가지로 코드 실행을 도구로 제공합니다. 코드 실행을 도구로 추가하면 모델이 이를 언제 사용할지 결정합니다.
코드 실행 환경에는 다음 라이브러리가 포함됩니다. altair
, chess
, cv2
, matplotlib
, mpmath
, numpy
, pandas
, pdfminer
, reportlab
, seaborn
, sklearn
, statsmodels
, striprtf
, sympy
, tabulate
. 자체 라이브러리는 설치할 수 없습니다.
시작하기 전에
Gemini API를 호출하기 전에 선택한 SDK가 설치되어 있고 Gemini API 키가 구성되어 있고 사용할 준비가 되었는지 확인합니다.
코드 실행 시작하기
입력/출력 (I/O)
Gemini 2.0 Flash부터 코드 실행은 파일 입력 및 그래프 출력을 지원합니다. 이러한 새로운 입력 및 출력 기능을 사용하면 CSV 및 텍스트 파일을 업로드하고, 파일에 대해 질문하고, 응답의 일부로 Matplotlib 그래프를 생성할 수 있습니다.
I/O 가격 책정
코드 실행 I/O를 사용하면 입력 토큰과 출력 토큰에 대해 요금이 부과됩니다.
입력 토큰:
- 사용자 프롬프트
출력 토큰:
- 모델에서 생성한 코드
- 코드 환경의 코드 실행 출력
- 모델이 생성한 요약
I/O 세부정보
코드 실행 I/O를 사용하는 경우 다음 기술 세부정보에 유의하세요.
- 코드 환경의 최대 런타임은 30초입니다.
- 코드 환경에서 오류가 발생하면 모델이 코드 출력을 재생성하기로 결정할 수 있습니다. 이 문제는 최대 5회 발생할 수 있습니다.
- 최대 파일 입력 크기는 모델 토큰 창에 따라 제한됩니다. AI Studio에서 Gemini Flash 2.0을 사용하는 경우 최대 입력 파일 크기는 토큰 100만 개입니다 (지원되는 입력 유형의 텍스트 파일의 경우 약 2MB). 너무 큰 파일을 업로드하면 AI Studio에서 보낼 수 없습니다.
싱글턴 | 양방향 (Multimodal Live API) | |
---|---|---|
지원되는 모델 | 모든 Gemini 2.0 모델 | 플래시 실험용 모델만 |
지원되는 파일 입력 유형 | .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts | .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts |
플로팅 라이브러리 지원 | Matplotlib | Matplotlib |
멀티툴 사용 | 아니요 | 예 |
결제
Gemini API에서 코드 실행을 사용 설정하는 데는 추가 요금이 부과되지 않습니다. 사용 중인 Gemini 모델을 기준으로 현재의 입력 및 출력 토큰 요율로 요금이 청구됩니다.
코드 실행의 청구에 대해 몇 가지 중요한 사항은 다음과 같습니다.
- 모델에 전달한 입력 토큰에 대해 한 번만 청구되며 모델이 반환하는 최종 출력 토큰에 대한 비용이 청구됩니다.
- 생성된 코드를 나타내는 토큰이 출력 토큰으로 집계됩니다. 생성된 코드에는 텍스트와 이미지 등의 멀티모달 출력이 포함될 수 있습니다.
- 코드 실행 결과도 출력 토큰으로 집계됩니다.
다음 다이어그램에 청구 모델이 나와 있습니다.
- 사용 중인 Gemini 모델을 기준으로 현재의 입력 및 출력 토큰 요율에 따라 요금이 청구됩니다.
- Gemini가 대답을 생성할 때 코드 실행을 사용하는 경우 원본 프롬프트, 생성된 코드, 실행된 코드의 결과가 중간 토큰이라는 라벨이 지정되고 입력 토큰으로 청구됩니다.
- 그런 다음 Gemini가 요약을 생성하고 생성된 코드, 실행된 코드의 결과, 최종 요약을 반환합니다. 출력 토큰으로 청구됩니다.
- Gemini API는 API 응답에 중간 토큰 수를 포함하므로 초기 프롬프트 외에 추가 입력 토큰을 받는 이유를 알 수 있습니다.
제한사항
- 모델은 코드를 생성 및 실행할 수만 있습니다. 미디어 파일과 같은 다른 아티팩트는 반환할 수 없습니다.
- 일부 경우에 코드 실행을 사용 설정하면 모델 출력의 다른 영역(예: 스토리 작성)에서 성능이 저하될 수 있습니다.
- 모델마다 코드 실행을 성공적으로 사용하는 기능에는 약간의 차이가 있습니다.