gemini 3

AI 벤치마크의 함정: 불공정한 경쟁 속 진정한 성능 평가는 가능한가?

최근 AI 분야에서 핫한 화제가 있었죠. 구글의 Gemini가 포켓몬 게임에서 Claude보다 더 잘 했다는 뉴스였습니다. 우와, 대단하죠? 그런데 잠깐만요! 알고 보니 Gemini는 미니맵이라는 특별한 도움을 받았다고 합니다. 이것이 바로 오늘 이야기할 AI 벤치마크의 불공정성 문제입니다.벤치마크 테스트, 정말 공정한가?AI 모델의 성능을 평가하는 벤치마크 테스트는 기술 발전을 측정하는 중요한 도구입니다. 하지만 최근 사례들을 보면 이 테스트가 얼마나 불완전한지 깨닫게 됩니다.앤트로픽의 Claude 3.7 Sonnet은 SWE-bench Verified에서 표준 방식으로 62.3%의 정확도를 기록했지만, "맞춤형 스캐폴드(custom scaffold)"를 사용했을 때는 70.3%로 점수가 훌쩍 뛰었습니..

카테고리 없음 2025.04.15

구글 Gemini Live, 실시간 시각 기능으로 AI 음성 비서 진화

구글이 Gemini Live 서비스에 카메라 및 화면 공유 기능을 새롭게 탑재했습니다. 이제 Pixel 9 시리즈와 삼성 갤럭시 S25 사용자들은 카메라로 보고 있는 대상이나 화면에 대해 AI와 실시간으로 대화할 수 있게 되었습니다. 이는 AI 비서가 단순 음성 인식을 넘어 시각적 세계를 이해하는 완전히 새로운 차원으로 발전했음을 의미합니다.Gemini Live의 새로운 시각 기능의 핵심Gemini Live의 시각 기능은 올해 초 구글 I/O 개발자 컨퍼런스에서 "Project Astra"라는 이름으로 시연되었던 기술이 실제 제품으로 구현된 것입니다. 이 기능을 통해 사용자는:카메라로 비추는 물체나 장면에 대해 즉시 질문하고 설명을 들을 수 있습니다쇼핑 웹사이트에서 제품을 비교하거나 스타일링 조언을 요청..

AI 2025.04.08

구글 Gemini 2.5 Pro API 가격 공개: 성능은 최고, 가격은 합리적

안녕하세요, 여러분! 오늘은 구글이 최근 공개한 Gemini 2.5 Pro API 가격에 대해 이야기해볼게요. 구글의 최신 AI 모델 소식을 놓치고 싶지 않으신 분들께 유용한 정보가 될 것입니다. Gemini 2.5 Pro란 무엇인가? 구글이 드디어 자사의 가장 발전된 AI 모델인 Gemini 2.5 Pro의 API 가격을 발표했습니다! 이 모델은 코딩, 추론, 수학 벤치마크에서 탁월한 성능을 보여주는 구글의 플래그십 모델이에요. 이전 모델들보다 확실히 개선된 성능을 자랑하며, 경쟁사 일부 모델들보다도 뛰어난 결과를 보여주고 있습니다.  Gemini 2.5 Pro API 가격 구조 가격 구조는 다음과 같이 설정되었습니다: - 200,000 토큰 이하 프롬프트:     - 입력 토큰 100만 개당 $1.2..

AI 2025.04.05