l3khub.com

강력한 OPEN LLM(대형언어모델) 팰컨 180B

1800억 개의 파라미터와 3조 5000억개의 토큰으로 학습된 대형언어모델 '팰컨 180B'는 뛰어난 성능과 혁신을 선보이며 생성 AI 분야를 리드하고 있습니다. 이 글에서는 UAE의 ATRC와 TII가 공동으로 개발한 팰컨 180B에 대해서 알아보겠습니다. 

강력한-OPEN-LLM-팰컨-180B-썸네일

강력한 OPEN LLM(대형언어모델) 팰컨 180B




세계에서 가장 강력한 LLM·생성AI 모델 '팰컨 180B'가 오픈소스로 공개되었습니다. 이 모델은 1800억 개의 파라미터를 사용하고 3조5000억개의 토큰으로 학습되었으며, 메타의 LLaMA 2에 비해 4배 더 많은 컴퓨팅 리소스를 활용하고 있습니다. 이 놀라운 모델은 AI 챗봇에서부터 코드 생성까지 다양한 분야에서 혁신적인 역할을 하고 있습니다.

UAE의 기술 혁신과 팰컨

아랍에미리트(UAE)의 글로벌 과학연구센터인 ATRC의 기술혁신연구소(TII)는 대형언어모델(LLM) 및 생성 AI(Generative AI) 분야에서 혁신을 지속적으로 이끌고 있습니다. UAE는 최초로 LLM 및 생성 AI 모델인 '팰컨 40B'을 지난 5월 오픈소스로 공개한 후, 고급 버전인 '팰컨 180B'를 단 몇 개월 만에 공개하였습니다.

특히, 팰컨 40B는 LLM 허깅페이스 리더보드에서 빠르게 상위권에 올라가며 성공을 거두었으며, 이로 인해 TII는 생성형 AI 분야에서 선두를 달리고 있습니다. UAE는 메타와 함께 LLM 민주화를 이끄는 중요한 역할을 하고 있으며, 이를 통해 AI 혁신의 긍정적인 영향을 모든 사람들이 누릴 수 있는 미래를 모색하고 있습니다.

팰컨 180B의 엄청난 성능

'팰컨 180B'는 1800억 개의 파라미터와 3조 5000억개의 토큰으로 학습된 모델로, 현재 LLM 허깅페이스 리더보드에서 정상에 올랐습니다. 이 모델은 다양한 벤치마크에서 뛰어난 성능을 보이며, 메타의 '라마 2(LLaMa2)'와 같은 유명 경쟁 모델보다 우수한 성과를 내고 있습니다.

또한, '팰컨 180B'는 오픈AI의 최신 GPT-4에 이어 2위를 차지하고 있으며, 크기에 비해 구글 바드(Bard)를 구동하는 모델인 구글의 PaLM 2 Large와 동등한 성능을 보입니다. 이 모델은 아파치 2.0(Apache 2.0)을 기반으로 하는 ‘팰컨 180B TII 라이선스’를 기반으로 설정되어 있어 자유롭게 사용할 수 있습니다.

AI 혁신을 위한 노력

TII의 책임자 겸 AI 크로스 센터 유닛 수석 연구원, 엡테삼 알마즘루에이 박사는 "팰컨 180B의 출시는 AI의 경계를 확장하기 위한 우리의 헌신을 잘 보여주는 예이며, 그 무한한 잠재력을 전 세계와 공유하게 돼 매우 기쁘다"고 말하며 "팰컨 180B는 미래의 혁신을 촉진하는 오픈 액세스를 통해 과학적 발전의 잠재력을 활용할 수 있는 새로운 생성형 AI 시대를 예고한다"고 설명했습니다.

TII는 이미 전 세계적으로 1200만명 이상의 개발자 및 연구자가 팰컨의 첫 번째 릴리스(팰컨 40B)를 채택하고 배포하면서 이번 팰컨 180B 업그레이드로 AI 챗봇에서부터 코드 생성까지 다양한 분야에서 글로벌 최고의 생성 AI 모델이 될 것으로 예상되고 있습니다. 이 모델은 영어, 독일어, 스페인어, 프랑스어 등 주요 언어를 지원하며 현재 허깅페이스를 통해 무료로 사용할 수 있습니다.


팰컨 180B의 등장으로 AI 혁신은 한층 더 밝고 흥미로운 방향으로 나아가고 있습니다. UAE의 ATRC와 TII가 선보이는 이러한 혁신은 미래를 위한 새로운 가능성을 열어주고 있습니다. AI 세계에서의 무한한 잠재력을 모두가 함께 공유하고, 협력과 연결을 통해 글로벌 과제를 해결하기 위한 노력이 계속될 것입니다.









To Top