코드 실행

Gemini API 코드 실행 기능을 사용하면 모델이 Python 코드를 생성 및 실행하고 최종 출력에 도달할 때까지 결과에서 반복적으로 학습할 수 있습니다. 이 코드 실행 기능을 사용하면 코드 기반 추론의 이점을 활용하며 텍스트 출력을 생성하는 애플리케이션을 빌드할 수 있습니다. 예를 들어 방정식을 풀거나 텍스트를 처리하는 애플리케이션에서 코드 실행을 사용할 수 있습니다.

코드 실행은 AI Studio와 Gemini API 모두에서 사용할 수 있습니다. AI Studio의 도구 아래 오른쪽 패널에서 코드 실행을 사용 설정할 수 있습니다. Gemini API는 함수 호출과 마찬가지로 코드 실행을 도구로 제공합니다. 코드 실행을 도구로 추가하면 모델이 이를 언제 사용할지 결정합니다.

코드 실행 환경에는 다음 라이브러리가 포함됩니다. altair, chess, cv2, matplotlib, mpmath, numpy, pandas, pdfminer, reportlab, seaborn, sklearn, statsmodels, striprtf, sympy, tabulate. 자체 라이브러리는 설치할 수 없습니다.

시작하기 전에

Gemini API를 호출하기 전에 선택한 SDK가 설치되어 있고 Gemini API 키가 구성되어 있고 사용할 준비가 되었는지 확인합니다.

코드 실행 시작하기

입력/출력 (I/O)

Gemini 2.0 Flash부터 코드 실행은 파일 입력 및 그래프 출력을 지원합니다. 이러한 새로운 입력 및 출력 기능을 사용하면 CSV 및 텍스트 파일을 업로드하고, 파일에 대해 질문하고, 응답의 일부로 Matplotlib 그래프를 생성할 수 있습니다.

I/O 가격 책정

코드 실행 I/O를 사용하면 입력 토큰과 출력 토큰에 대해 요금이 부과됩니다.

입력 토큰:

  • 사용자 프롬프트

출력 토큰:

  • 모델에서 생성한 코드
  • 코드 환경의 코드 실행 출력
  • 모델이 생성한 요약

I/O 세부정보

코드 실행 I/O를 사용하는 경우 다음 기술 세부정보에 유의하세요.

  • 코드 환경의 최대 런타임은 30초입니다.
  • 코드 환경에서 오류가 발생하면 모델이 코드 출력을 재생성하기로 결정할 수 있습니다. 이 문제는 최대 5회 발생할 수 있습니다.
  • 최대 파일 입력 크기는 모델 토큰 창에 따라 제한됩니다. AI Studio에서 Gemini Flash 2.0을 사용하는 경우 최대 입력 파일 크기는 토큰 100만 개입니다 (지원되는 입력 유형의 텍스트 파일의 경우 약 2MB). 너무 큰 파일을 업로드하면 AI Studio에서 보낼 수 없습니다.
싱글턴 양방향 (Multimodal Live API)
지원되는 모델 모든 Gemini 2.0 모델 플래시 실험용 모델만
지원되는 파일 입력 유형 .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts .png, .jpeg, .csv, .xml, .cpp, .java, .py, .js, .ts
플로팅 라이브러리 지원 Matplotlib Matplotlib
멀티툴 사용 아니요

결제

Gemini API에서 코드 실행을 사용 설정하는 데는 추가 요금이 부과되지 않습니다. 사용 중인 Gemini 모델을 기준으로 현재의 입력 및 출력 토큰 요율로 요금이 청구됩니다.

코드 실행의 청구에 대해 몇 가지 중요한 사항은 다음과 같습니다.

  • 모델에 전달한 입력 토큰에 대해 한 번만 청구되며 모델이 반환하는 최종 출력 토큰에 대한 비용이 청구됩니다.
  • 생성된 코드를 나타내는 토큰이 출력 토큰으로 집계됩니다. 생성된 코드에는 텍스트와 이미지 등의 멀티모달 출력이 포함될 수 있습니다.
  • 코드 실행 결과도 출력 토큰으로 집계됩니다.

다음 다이어그램에 청구 모델이 나와 있습니다.

코드 실행 청구 모델

  • 사용 중인 Gemini 모델을 기준으로 현재의 입력 및 출력 토큰 요율에 따라 요금이 청구됩니다.
  • Gemini가 대답을 생성할 때 코드 실행을 사용하는 경우 원본 프롬프트, 생성된 코드, 실행된 코드의 결과가 중간 토큰이라는 라벨이 지정되고 입력 토큰으로 청구됩니다.
  • 그런 다음 Gemini가 요약을 생성하고 생성된 코드, 실행된 코드의 결과, 최종 요약을 반환합니다. 출력 토큰으로 청구됩니다.
  • Gemini API는 API 응답에 중간 토큰 수를 포함하므로 초기 프롬프트 외에 추가 입력 토큰을 받는 이유를 알 수 있습니다.

제한사항

  • 모델은 코드를 생성 및 실행할 수만 있습니다. 미디어 파일과 같은 다른 아티팩트는 반환할 수 없습니다.
  • 일부 경우에 코드 실행을 사용 설정하면 모델 출력의 다른 영역(예: 스토리 작성)에서 성능이 저하될 수 있습니다.
  • 모델마다 코드 실행을 성공적으로 사용하는 기능에는 약간의 차이가 있습니다.