무슨 시험 문제 풀어서 인간과 비교하는 기사들
실시간 시험도 아니고 수능이 어떻고 변호사시험이 어떻고 하면서 기출문제를 풀게 시켰는데 이만큼 하더라 라는데
애시당초 인간과 유사 검색엔진이 기출문제 풀이를 겨루는거 자체가 이상하지 않은지
무슨 시험 문제 풀어서 인간과 비교하는 기사들
실시간 시험도 아니고 수능이 어떻고 변호사시험이 어떻고 하면서 기출문제를 풀게 시켰는데 이만큼 하더라 라는데
애시당초 인간과 유사 검색엔진이 기출문제 풀이를 겨루는거 자체가 이상하지 않은지
기출이면 100점이 아닌게 오히려 이상한거 아냐?
인터넷에서찾아서답변하는거아니냐
스타터업 기사는 그래서 대부분 사기임
왜 100점이 아닌거지 데이터오염때문인가
검색해서풀면 100점일텐데
오히려 사실상 오픈북 테스트하는 로봇새1끼들 만점 못받은게 더 문제 아니내
이게 이상한가?
답변집이 업로드된 적 없거나 학습데이터/검석데이터에 제한두고 하는 게 국제 표준 방식인데 저러는 게 웃음벨임
인터넷에서찾아서답변하는거아니냐
기출이면 100점이 아닌게 오히려 이상한거 아냐?
이게 이상한가?
인제 AI 라는걸 당연하게 받아드리는 수준까지 와서 이상하다고 생각하는거임
왜 100점이 아닌거지 데이터오염때문인가
검색해서풀면 100점일텐데
스타터업 기사는 그래서 대부분 사기임
답변집이 업로드된 적 없거나 학습데이터/검석데이터에 제한두고 하는 게 국제 표준 방식인데 저러는 게 웃음벨임
오히려 사실상 오픈북 테스트하는 로봇새1끼들 만점 못받은게 더 문제 아니내
추론해서 푸는거 기준 아님?
저거 논문도 안 나오고 언플기사부터 나옴
제대로 된 물건은 아니란 소리임
지금 ai 스타터업 지원준다고 목돈 생기닠가 어글글려고 기사부터 던지는거
자기모델도 아니고 남의 모델로 돌려봤습니다 기사는 진짜
https://humanf.co.kr/contents/?bmode=view&idx=130100170
웜래 미스트랄 큐웬계열 파인튜닝 모델 내던 데임
22년엔 상상도 못하는거긴 했음 ㅋㅋ
자동차랑 달리기 선수랑 속도 비교해서 의미가 있음?
내가 이번주에 온라인 안전관리자 교육듣고 시험봐서 60점이상 수료가능이길래 캡쳐해서 gpt보고 답 알려달랬더니 30점 나오던데?
Chatgpt말고 api-tool calling 기준으로 하나부터 다 만듷어야 제대로 된 성능이 나오긴 함
저런거 할때 웹검색은 끄고 내부저장된 모델로만 돌리던데 핵심은 데이터가 모델있다 없다가 아니라 지문을 읽고 맞는 답을 가져오는 능력 때문에 저런거 하는거지...
사실 진짜 의의는 'AI가 글을 읽고 문제를 해결할 수 있다'는 점에 있기는 한데