구글의 똑똑한 새 AI 모델: '가성비 끝판왕' 제미나이 2.5 플래시 프리뷰 (Preview 04-17)를 파헤쳐 봅시다!

안녕하세요! 미래 기술에 관심 많은 친구들, 그리고 AI에 대해 더 자세히 알고 싶은 분들! 오늘은 구글이 최근 공개한 아주 흥미로운 AI 모델, '제미나이 2.5 플래시 Preview 04-17'에 대해 이야기해 볼 거예요. 이름이 조금 길고 복잡해 보이지만, 우리가 매일 사용하는 스마트폰이나 인터넷 검색만큼이나 우리 삶에 큰 변화를 가져올 수 있는 기술이랍니다.

이번에 나온 '제미나이 2.5 플래시'는 이전 모델들과 어떤 점이 다르고, 왜 '가성비 끝판왕'이라고 불리는지, 그리고 우리가 이 똑똑한 AI를 더 잘 활용하려면 어떻게 해야 하는지, 중학생 친구들도 쉽게 이해할 수 있도록 탐정처럼 자세히 파헤쳐 보겠습니다! 특히 이번에 '미리보기(Preview)' 형태로 공개된 'Preview 04-17' 버전의 특징과 설정에 대해서도 자세히 알려드릴게요.

제미나이 2.5 플래시, 뭐가 달라졌을까요?

구글은 이미 '제미나이'라는 이름으로 여러 종류의 AI 모델을 선보였어요. 그중 '플래시(Flash)' 모델은 빠르게 응답하고 효율적으로 작동하는 데 초점을 맞춘 모델이었죠. 그런데 이번에 나온 '제미나이 2.5 플래시'는 한 단계 더 발전했습니다. 가장 큰 특징은 기사에서도 강조한 '하이브리드 추론' 능력과 '가성비'예요.

이전 모델과 이번 '제미나이 2.5 플래시 Preview 04-17' 버전의 주요 차이점을 표로 정리해 볼까요?

구분	이전 모델 (예: Gemini 2.0 Flash)	새로운 모델 (Gemini 2.5 Flash Preview 04-17)
핵심 특징	빠르고 효율적인 응답	향상된 추론 능력 + 뛰어난 가성비
추론 능력	기본적인 추론 가능	대폭 향상된 '사고(Thinking)' 기능 탑재
모델 설계 목표	저지연(빠른 반응), 고성능 요구 작업	AI 에이전트 등 복잡한 작업 처리 + 범용성
비용 및 성능 조절	주로 모델 선택에 따라 고정됨	'사고 예산(Thinking Budget)' 기능으로 조절 가능
출시 형태	정식 또는 이전 프리뷰	Preview 04-17 (2024년 4월 17일 공개 미리보기)
벤치마크 성능	(Humanity's Last Exam) 5.1% 수준	(Humanity's Last Exam) 12.1%로 2배 이상 향상
주요 강점	빠른 속도	성능 대비 합리적인 가격 (가성비)

표를 보면 가장 눈에 띄는 차이점은 '향상된 추론 능력'과 이와 관련된 '사고 예산' 기능의 도입입니다. 그럼 이 기능들이 정확히 무엇인지, 왜 중요한지 자세히 알아볼게요.

AI가 '사고'를 한다고요? '하이브리드 추론'과 '사고 예산'의 비밀

AI가 '생각한다'는 말이 신기하게 들릴 거예요. 여기서 '사고' 또는 '추론'은 AI가 사람처럼 감정을 느끼거나 의식을 갖는다는 뜻이 아니에요. 대신, 복잡한 문제나 질문에 대해 여러 정보를 연결하고, 논리적으로 따져보고, 단계별로 해결책을 찾아나가는 능력을 말합니다.

예를 들어, "내가 좋아하는 영화 장르(액션, 코미디)와 배우(톰 크루즈)를 고려해서 이번 주말 볼 만한 영화 세 편 추천해줘"라고 AI에게 물어보면,

추론 능력이 낮은 AI: 그냥 인기 영화 목록을 보여주거나, 톰 크루즈 나오는 영화 목록만 보여줄 수 있어요.
추론 능력이 높은 AI (제미나이 2.5 플래시 같은): '액션'과 '코미디' 장르를 모두 포함하거나 그중 하나에 해당하고, '톰 크루즈'가 출연한 영화들을 데이터베이스에서 찾아요. 그런 다음, 이 조건들을 모두 만족하는 영화들 중 세 편을 골라서 추천해 줄 거예요. 이 과정에서 AI는 주어진 여러 조건(장르, 배우)을 종합적으로 고려해서 최적의 결과를 도출합니다. 이게 바로 '추론' 능력이 작동하는 방식이죠.

제미나이 2.5 플래시는 이런 추론 능력을 이전 플래시 모델보다 훨씬 강화했어요. 그리고 이게 '하이브리드'라는 이름이 붙은 이유와 연결됩니다. 간단하고 빠른 응답이 필요할 때는 효율적으로 작동하고, 복잡한 추론이 필요할 때는 마치 '생각 모드'로 전환하여 더 깊이 있게 문제를 해결하는 방식이죠. 마치 필요에 따라 엔진을 고속으로 돌리거나 연비를 생각하며 부드럽게 운전하는 하이브리드 자동차처럼요.

AI의 '사고' 능력: 트랜스포머와 사고의 연쇄

그렇다면 AI는 어떻게 이런 '사고'나 '추론'을 할 수 있게 되는 걸까요? 그 바탕에는 '딥러닝(Deep Learning)'이라는 인공지능 기술이 있어요. 특히, 요즘의 똑똑한 AI 모델들은 대부분 '트랜스포머(Transformer)'라는 특별한 인공 신경망 구조를 사용합니다. (Vaswani et al., 2017) 트랜스포머는 문장 속 단어들이 서로에게 얼마나 중요한 영향을 미치는지 ('어텐션 메커니즘'이라고 불러요) 잘 파악해서, 단순히 단어 순서대로 읽는 것을 넘어 문장의 의미와 맥락을 깊이 이해할 수 있게 해줍니다.

AI 모델은 인터넷에 있는 엄청나게 많은 양의 글, 코드, 이미지 등을 학습하면서 복잡한 언어 패턴과 지식을 쌓게 됩니다. 그리고 추론은 이러한 학습된 패턴을 바탕으로 새로운 문제에 적용하여 논리적인 단계를 거쳐 답을 찾아내는 과정이에요.

최근 연구에서는 AI에게 좀 더 효율적으로 추론하도록 유도하는 방법들이 개발되었는데, 그중 하나가 '사고의 연쇄(Chain-of-Thought)' 프롬프팅입니다. (Wei et al., 2022) 이건 AI에게 "답만 알려주지 말고, 문제를 푸는 과정을 단계별로 설명해 줘"라고 지시하는 거예요.

신기하게도, AI가 문제를 해결하는 중간 과정을 스스로 보여주면서 최종 답의 정확도가 높아진다고 해요. 마치 우리가 어려운 수학 문제를 풀 때 바로 답을 쓰는 것보다 풀이 과정을 하나하나 적어 내려가는 것이 실수를 줄이고 정확도를 높이는 것과 비슷하죠.

제미나이 2.5 플래시의 '향상된 추론 능력'은 바로 이러한 최신 딥러닝 기술과 추론 기법들이 적용된 결과라고 할 수 있습니다.

'사고 예산' 기능: 똑똑함과 효율성을 내 마음대로 조절!

제미나이 2.5 플래시의 가장 사용자 친화적인 기능 중 하나는 '사고 예산(Thinking Budget)'입니다. 기사에도 언급되었듯이, 이 기능은 AI가 문제 해결을 위해 얼마나 많은 '생각' 자원을 사용할지 개발자나 사용자가 직접 설정할 수 있게 해줍니다.

'생각 자원'이라는 것은 AI 모델이 내부적으로 추론 과정을 거치는 데 필요한 계산량과 관련이 있고, 이는 '토큰(Token)' 사용량으로 나타납니다. 토큰은 AI가 텍스트를 처리하는 기본 단위라고 생각하면 쉬워요 (단어나 글자 조각 같은 것). AI가 더 깊이 생각하려면 더 많은 토큰을 사용하게 되고, 이는 응답 시간 증가와 비용 상승으로 이어집니다.

'사고 예산'은 바로 이 토큰 사용량의 최대치를 설정하는 기능이에요.

사고 예산을 높게 설정: AI가 더 많은 토큰을 사용하며 꼼꼼하게 생각합니다. 결과의 품질과 정확도가 높아지지만, 응답이 느려지고 비용도 비싸져요. (마치 어려운 문제에 시간을 쏟아 완벽하게 푸는 것)
사고 예산을 낮게 설정: AI가 최소한의 토큰만 사용하며 빠르게 답을 찾습니다. 응답 속도가 매우 빠르고 비용이 저렴하지만, 복잡한 문제에서는 결과의 정확도가 떨어질 수 있어요. (마치 쉬운 문제라 빠르게 답을 내는 것)

제미나이 2.5 플래시는 질문의 복잡도에 따라 사고 예산을 자동으로 조절하는 기능도 가지고 있다고 해요. 간단한 질문에는 빠르게 답하고, 복잡한 질문에는 더 많은 '생각' 시간을 할애하는 거죠. 이 기능 덕분에 사용자는 필요한 작업의 성격에 맞춰 AI의 작동 방식을 최적화하고, 비용 효율성을 극대화할 수 있습니다. 이게 바로 이 모델이 '가성비 끝판왕'이라고 불리는 이유입니다!

Preview 04-17 버전에서 'Run Settings'란 무엇일까?

우리가 지금 이야기하고 있는 제미나이 2.5 플래시는 'Preview 04-17'이라는 이름으로 공개되었습니다. '프리뷰(Preview)'는 말 그대로 '미리 보기' 버전으로, 아직 정식으로 출시되기 전에 개발자나 사용자들이 미리 사용해보고 의견을 전달하여 모델을 개선하는 과정이에요.

이 'Preview 04-17' 버전에서 개발자들이 제미나이 2.5 플래시를 사용할 때 중요한 설정 중 하나가 바로 'Run Settings'일 거예요. 'Run Settings'는 모델을 실행할 때 적용하는 여러 가지 설정들을 모아놓은 것인데, Preview 04-17의 핵심 기능인 '사고 예산'과 관련된 설정들이 포함되어 있을 가능성이 매우 높습니다.

예상되는 'Run Settings' 항목들은 다음과 같습니다.

사고 예산 슬라이더 또는 값 설정: '사고 예산' 수준을 직접 조절하는 기능입니다. 아마도 낮은 예산부터 높은 예산까지 단계별로 설정하거나, 구체적인 토큰 사용량 한도를 입력하는 방식일 수 있어요.
사고 기능 켜기/끄기: 필요에 따라 추론 기능 자체를 완전히 비활성화하여 가장 빠르고 저렴하게 사용할 수 있도록 하는 옵션입니다.
복잡도 자동 감지 모드: AI가 질문의 복잡성을 스스로 판단하여 사고 예산을 자동으로 조절하게 할 것인지를 선택하는 기능일 수 있습니다.

개발자들은 이 'Run Settings'에서 다양한 조합으로 AI를 테스트하면서, 자신들이 만들고 싶은 서비스(예: AI 챗봇, 자동 글쓰기 도구, 코드 생성기 등)에 어떤 '사고 예산' 설정이 가장 적합한지 실험해 볼 수 있습니다. 어떤 설정에서 응답 속도가 가장 빠르고, 어떤 설정에서 답변의 정확도가 가장 높은지 등을 비교해 볼 수 있죠. 구글은 이 프리뷰를 통해 개발자들로부터 '사고 예산' 기능이 실제 개발 환경에서 어떻게 작동하는지에 대한 소중한 피드백을 얻으려고 할 것입니다.

제미나이 2.5 플래시 Preview 04-17, 똑똑하게 잘 사용하려면?

제미나이 2.5 플래시 Preview 04-17을 개발자 플랫폼(구글 AI 스튜디오, 버텍스 AI)이나 일반 사용자용 제미나이 앱에서 사용하게 된다면, '사고 예산' 기능 덕분에 훨씬 유연하게 AI를 활용할 수 있습니다. 다음은 몇 가지 사용 팁이에요.

작업의 성격을 먼저 파악하세요:
- 빠른 답변/정보 검색: 간단한 질문(예: "파리 에펠탑 높이는?", "내일 날씨 어때?")이나 창의적인 글쓰기 아이디어 얻기 등 빠른 속도가 중요한 작업이라면, '사고 예산'을 낮게 설정하거나 '사고 기능'을 꺼서 비용과 속도를 최적화하세요.
- 복잡한 문제 해결/심층 분석: 복잡한 코드를 짜거나, 논리적인 분석이 필요한 글을 쓰거나, 어려운 질문에 대한 정확한 답변을 얻고 싶다면, '사고 예산'을 높게 설정하여 AI가 충분히 '생각'할 시간을 주세요.
'사고 예산' 설정을 실험해 보세요: Preview 버전의 가장 큰 목적 중 하나는 테스트입니다. 같은 질문이나 작업에 대해 '사고 예산' 설정을 다르게 해보면서 결과의 품질, 응답 속도, 비용을 비교해 보세요. 여러분의 작업에 가장 적합한 최적의 설정을 찾을 수 있을 거예요. 'Run Settings'에서 이 부분을 집중적으로 조작해 보세요.
AI 에이전트 개발에 활용하세요: 제미나이 2.5 플래시는 AI 에이전트 구동에 맞춰 설계되었다고 해요. 사용자의 다양한 명령을 이해하고 여러 도구와 연동하여 작업을 수행하는 AI 비서를 만들고 싶다면, 이 모델의 향상된 추론 능력이 큰 도움이 될 것입니다. '사고 예산'을 적절히 활용하여 에이전트의 '똑똑함' 수준을 조절할 수 있습니다.
복잡한 질문에는 '사고의 연쇄'를 유도해 보세요: 만약 AI에게 복잡한 문제를 풀게 한다면, 단순히 질문만 던지지 말고 "단계별로 생각해 줘"와 같은 프롬프트(명령)를 추가해 보세요. AI가 문제를 해결하는 과정을 보여주게 함으로써 더 정확하고 신뢰할 수 있는 답변을 얻을 수 있습니다. (이것이 '사고 예산'을 높게 설정했을 때 내부적으로 일어나는 과정과 연결될 수 있습니다.)

AI 기술의 흥미로운 미래를 엿보다

구글의 제미나이 2.5 플래시 Preview 04-17 출시는 AI 기술이 최고 성능 경쟁을 넘어 실용성과 경제성을 동시에 추구하는 방향으로 나아가고 있음을 보여줍니다. 강력한 추론 능력을 갖추되, 사용자의 필요와 예산에 맞춰 성능을 조절할 수 있는 '사고 예산' 기능은 AI 기술이 더 많은 사람에게, 더 다양한 분야에서 활용될 수 있도록 하는 중요한 발걸음입니다.

이미 앤트로픽이나 누스리서치 같은 다른 AI 기업들도 유사한 시도를 하고 있으며, 오픈AI 역시 앞으로의 모델에 이런 기능을 통합할 예정이라고 하니, 앞으로 AI 모델들은 단순히 '가장 강력한' 것뿐만 아니라 '가장 효율적이고 유연한' 형태로 발전해 나갈 것으로 예상됩니다.

제미나이 2.5 플래시 Preview 04-17은 그 변화의 시작을 알리는 중요한 모델입니다. 앞으로 이 모델이 어떻게 발전하고 우리의 삶에 어떤 영향을 미칠지 기대되네요!

참고자료

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30. (현대 거대 언어 모델의 기반이 되는 트랜스포머 구조에 대한 연구)
Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, F., Ryder, B., ... & Le, Q. V. (2022). Chain-of-thought prompting elicits reasoning in large language models. Advances in Neural Information Processing Systems, 35, 24824-24837. (거대 언어 모델에서 '사고의 연쇄'와 같은 프롬프팅 기법이 추론 능력을 이끌어내는 방법에 대한 연구)
Gemini 2.5 Flash with ‘thinking budget’ rolling out to devs, Gemini app (https://9to5google.com/2025/04/17/gemini-2-5-flash-preview-launch/)

궁금한 기록

구글의 똑똑한 새 AI 모델: '가성비 끝판왕' 제미나이 2.5 플래시 프리뷰 (Preview 04-17)