AI/ML - MultiModal Foundation Model Researcher (석사 이상)
Job group
Research
Job
Research Engineer
Experience Level
Experienced 2 years or more
Job Types
Full-time
Locations
서울서울특별시 강남구 남부순환로359길 29, 사이오닉에이아이
Remote

비개발자도 자연어로 ​쉽게 ​AI ​Agent를 생성할 ​수 있고, 목적에 맞게 ​커스텀한 ​AI Agent를 ​활용해 업무를 효율화합니다


우리가 ​성공할 수 ​밖에 ​없는 이유 ​🚀


명확한 ​시장의 ​니즈 🎯

  • 많은 기업들이 ​AI ​도입의 필요성은 느끼지만, ​어떤 ​업무를 ​어떻게 AI로 효율화해야 ​하는지에 대한 ​명확한 ​답을 찾지 ​못하고 있어요.
  • AI ​적용 ​방향이 정의되더라도, 이를 ​실제로 실행하고 ​운영할 수 있는 유저 친화적인 도구가 부족해 도입이 지연되거나 PoC에 머무는 경우가 많아요.
  • Sionic AI의 플랫폼은 기술과 기업 사이의 간극을 잇는 다리로서, AI가 실제 비즈니스 성과로 이어지도록 돕습니다.


독보적인 기술력 🧑‍💻

  • Sionic AI는 LLM, RAG, Parser 등 생성형 AI에 필수적인 핵심 기술을 모두 자체 보유하고 있으며, 이를 독자적인 제품 설계에 활용하고 있어요.
  • 자체 개발한 Embedding 모델은 글로벌 MTBE 1위를 달성했으며, sLLM 또한 주요 벤치마크에서 상위권 성과를 기록하며 기술력을 입증했어요.


서로에 대한 믿음 아래 만들어진 문화와 유연한 근무 환경 💼

  • 서로에 대한 신뢰를 바탕으로, 각자가 주도적으로 문제를 정의하고 해결하는 문화를 지향해요.
  • 자율적인 판단 하에 원하는 시간과 장소에서 몰입할 수 있는 근무 환경을 제공해요
  • 업무에 필요한 도구와 지원에 있어 회사의 아낌없는 지원을 받습니다.


네이버, 라인, 토스 등에서 AI 경험을 쌓은 초기 멤버와 함께하세요 🙌




우리는 당신이 필요해요! 😉


우리는 이러한 가치들을 제공해드릴 수 있어요


우리가 풀고 있는 문제

쉽게 사용할 수 있는 AI 기술을 위해서는 사람 말을 잘 이해할 수 있는 AI가 필요해요. Sionic AI는 기업이 자신만의 AI Agent를 생성할 수 있는 플랫폼 Storm을 만들고 있고, AI 모델 및 시스템 개발/최적화를 통해 이 AI-native 제품을 더욱 강력하고 혁신적으로 만들어 고객에게 최상의 경험을 제공하고자 해요.


MultiModal 팀은 이 플랫폼의 시각 이해 능력을 책임지는 팀이에요.

  • Storm Parse — 표, 그래프, 도면 등 복잡한 비즈니스 문서를 정확하게 파싱하는 특화 모델 개발
  • VLM/LMM 사후학습 및 정렬 — 다국어 멀티모달 모델의 파인튜닝 및 고도화
  • 일본어 특화 모델 — 일본 비즈니스 도메인에 최적화된 모델 개발


이 도전을 함께할 분을 찾고 있어요.




합류하면 함께 할 업무에요 🤲


Sionic AI의 AI Researcher는 아래 업무들을 담당해요.

  • MultiModal Foundation Model 연구 및 고도화
  • Supervised Fine-Tuning, RLHF/GRPO 기반 멀티모달 모델 정렬 및 성능 최적화
  • 비즈니스 도메인 특화 VLM 모델 개발 — 표, 그래프, 도면, 차트 등 복잡한 문서 구조를 정확하게 이해하는 모델 구축
  • 다국어 멀티모달 LMM(Large Multimodal Model)의 지속적 성능 개선 및 고도화
  • 일본어 비즈니스 도메인 특화 모델 개발 — 일본어 성능 개선을 위한 데이터 수집/처리 전략 수립 및 학습 파이프라인 구축


  • Agentic VLM 연구
  • 문서 이해 과정에서 자율적 영역 탐색(Visual Grounding), 도구 활용, 반복 추론이 가능한 Agentic VLM 파이프라인 설계 및 개발
  • Visual Reasoning — 복잡한 표, 차트, 다이어그램에 대한 Chain-of-Thought 기반 시각 추론 능력 강화


  • 평가 체계 설계 및 구축
  • 문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용
  • 실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입
  • 지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현


  • 데이터 수집 파이프라인 설계 및 구축
  • 멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축
  • 데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용
  • 최신 GPU 클러스터(8노드) 환경에서의 분산 학습 설계 및 운영


  • 논문 및 특허
  • 연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유
  • 최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유


Sionic AI의 AI Researcher는 이런 환경에 일해요.

최신 세대 GPU 8노드 클러스터를 내부 인프라로 보유하고 있으며, 대규모 멀티모달 모델 학습에 필요한 컴퓨팅 자원을 자체적으로 운영합니다. 연구에 필요한 인프라 투자에 아낌없는 지원을 하고 있어요.




이런 분과 함께하고 싶어요 🤝


  • 석사 학위 이상 소유자로 AI 관련 2년 이상의 실무 경력, 또는 AI 관련 3년 이상의 실무 경력을 보유하신 분
  • 컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 LLM 분야의 최신 알고리즘, 논문, 모델에 대한 깊은 이해가 있는 분
  • LMM/VLM 모델을 연구하거나 관련 어플리케이션에 적용해본 경험이 있는 분
  • 문서 기반 멀티모달 또는 자연어와 이미지 응용 분야에서 프로젝트를 진행해본 경험이 있는 분
  • AI 문제를 주도적으로 정의하고 해결할 수 있는 분
  • 하나의 문제를 깊이 파고드는 끈기가 있는 분




이런 분이면 더 좋아요! 👍


  • 탑티어 국제 학회(ICML, NeurIPS, ICLR, CVPR, ACL, ICCV, ECCV, AAAI, NAACL, EMNLP 등)에 1저자 또는 교신저자로 논문을 출판한 경험이 있는 분
  • Visual Reasoning, Agentic VLM, Visual Grounding, 또는 GUI Agent 관련 연구 경험이 있는 분
  • VLM, LMM, 또는 LLM의 사전학습(Pretraining) 또는 지속학습(Continual Pretraining) 경험이 있는 분
  • 대규모 데이터로부터 AI 모델 학습 및 추론을 위한 data/model pipeline을 개발한 경험이 있는 분
  • 번뜩이는 아이디어를 AI 기술을 활용하여 프로토타입으로 만들어 본 분
  • 업무에 필요한 일본어를 구사할 수 있거나, 일본 시장 대상 AI 서비스 경험이 있는 분




이런 팀 문화에 공감하고 함께하실 분을 찾고 있어요 🔍


  • 주도적으로 문제를 정의하고 의견을 제시하는 분
  • 상대방의 의견을 경청하면서 적극적으로 소통할 수 있는 분
  • 자신이 해야 할 업무에 대해 '왜'를 항상 생각하는 분
  • 결정을 미루지 않고 바로 해결하는 것을 좋아하는 분


Share
AI/ML - MultiModal Foundation Model Researcher (석사 이상)

비개발자도 자연어로 ​쉽게 ​AI ​Agent를 생성할 ​수 있고, 목적에 맞게 ​커스텀한 ​AI Agent를 ​활용해 업무를 효율화합니다


우리가 ​성공할 수 ​밖에 ​없는 이유 ​🚀


명확한 ​시장의 ​니즈 🎯

  • 많은 기업들이 ​AI ​도입의 필요성은 느끼지만, ​어떤 ​업무를 ​어떻게 AI로 효율화해야 ​하는지에 대한 ​명확한 ​답을 찾지 ​못하고 있어요.
  • AI ​적용 ​방향이 정의되더라도, 이를 ​실제로 실행하고 ​운영할 수 있는 유저 친화적인 도구가 부족해 도입이 지연되거나 PoC에 머무는 경우가 많아요.
  • Sionic AI의 플랫폼은 기술과 기업 사이의 간극을 잇는 다리로서, AI가 실제 비즈니스 성과로 이어지도록 돕습니다.


독보적인 기술력 🧑‍💻

  • Sionic AI는 LLM, RAG, Parser 등 생성형 AI에 필수적인 핵심 기술을 모두 자체 보유하고 있으며, 이를 독자적인 제품 설계에 활용하고 있어요.
  • 자체 개발한 Embedding 모델은 글로벌 MTBE 1위를 달성했으며, sLLM 또한 주요 벤치마크에서 상위권 성과를 기록하며 기술력을 입증했어요.


서로에 대한 믿음 아래 만들어진 문화와 유연한 근무 환경 💼

  • 서로에 대한 신뢰를 바탕으로, 각자가 주도적으로 문제를 정의하고 해결하는 문화를 지향해요.
  • 자율적인 판단 하에 원하는 시간과 장소에서 몰입할 수 있는 근무 환경을 제공해요
  • 업무에 필요한 도구와 지원에 있어 회사의 아낌없는 지원을 받습니다.


네이버, 라인, 토스 등에서 AI 경험을 쌓은 초기 멤버와 함께하세요 🙌




우리는 당신이 필요해요! 😉


우리는 이러한 가치들을 제공해드릴 수 있어요


우리가 풀고 있는 문제

쉽게 사용할 수 있는 AI 기술을 위해서는 사람 말을 잘 이해할 수 있는 AI가 필요해요. Sionic AI는 기업이 자신만의 AI Agent를 생성할 수 있는 플랫폼 Storm을 만들고 있고, AI 모델 및 시스템 개발/최적화를 통해 이 AI-native 제품을 더욱 강력하고 혁신적으로 만들어 고객에게 최상의 경험을 제공하고자 해요.


MultiModal 팀은 이 플랫폼의 시각 이해 능력을 책임지는 팀이에요.

  • Storm Parse — 표, 그래프, 도면 등 복잡한 비즈니스 문서를 정확하게 파싱하는 특화 모델 개발
  • VLM/LMM 사후학습 및 정렬 — 다국어 멀티모달 모델의 파인튜닝 및 고도화
  • 일본어 특화 모델 — 일본 비즈니스 도메인에 최적화된 모델 개발


이 도전을 함께할 분을 찾고 있어요.




합류하면 함께 할 업무에요 🤲


Sionic AI의 AI Researcher는 아래 업무들을 담당해요.

  • MultiModal Foundation Model 연구 및 고도화
  • Supervised Fine-Tuning, RLHF/GRPO 기반 멀티모달 모델 정렬 및 성능 최적화
  • 비즈니스 도메인 특화 VLM 모델 개발 — 표, 그래프, 도면, 차트 등 복잡한 문서 구조를 정확하게 이해하는 모델 구축
  • 다국어 멀티모달 LMM(Large Multimodal Model)의 지속적 성능 개선 및 고도화
  • 일본어 비즈니스 도메인 특화 모델 개발 — 일본어 성능 개선을 위한 데이터 수집/처리 전략 수립 및 학습 파이프라인 구축


  • Agentic VLM 연구
  • 문서 이해 과정에서 자율적 영역 탐색(Visual Grounding), 도구 활용, 반복 추론이 가능한 Agentic VLM 파이프라인 설계 및 개발
  • Visual Reasoning — 복잡한 표, 차트, 다이어그램에 대한 Chain-of-Thought 기반 시각 추론 능력 강화


  • 평가 체계 설계 및 구축
  • 문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용
  • 실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입
  • 지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현


  • 데이터 수집 파이프라인 설계 및 구축
  • 멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축
  • 데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용
  • 최신 GPU 클러스터(8노드) 환경에서의 분산 학습 설계 및 운영


  • 논문 및 특허
  • 연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유
  • 최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유


Sionic AI의 AI Researcher는 이런 환경에 일해요.

최신 세대 GPU 8노드 클러스터를 내부 인프라로 보유하고 있으며, 대규모 멀티모달 모델 학습에 필요한 컴퓨팅 자원을 자체적으로 운영합니다. 연구에 필요한 인프라 투자에 아낌없는 지원을 하고 있어요.




이런 분과 함께하고 싶어요 🤝


  • 석사 학위 이상 소유자로 AI 관련 2년 이상의 실무 경력, 또는 AI 관련 3년 이상의 실무 경력을 보유하신 분
  • 컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 LLM 분야의 최신 알고리즘, 논문, 모델에 대한 깊은 이해가 있는 분
  • LMM/VLM 모델을 연구하거나 관련 어플리케이션에 적용해본 경험이 있는 분
  • 문서 기반 멀티모달 또는 자연어와 이미지 응용 분야에서 프로젝트를 진행해본 경험이 있는 분
  • AI 문제를 주도적으로 정의하고 해결할 수 있는 분
  • 하나의 문제를 깊이 파고드는 끈기가 있는 분




이런 분이면 더 좋아요! 👍


  • 탑티어 국제 학회(ICML, NeurIPS, ICLR, CVPR, ACL, ICCV, ECCV, AAAI, NAACL, EMNLP 등)에 1저자 또는 교신저자로 논문을 출판한 경험이 있는 분
  • Visual Reasoning, Agentic VLM, Visual Grounding, 또는 GUI Agent 관련 연구 경험이 있는 분
  • VLM, LMM, 또는 LLM의 사전학습(Pretraining) 또는 지속학습(Continual Pretraining) 경험이 있는 분
  • 대규모 데이터로부터 AI 모델 학습 및 추론을 위한 data/model pipeline을 개발한 경험이 있는 분
  • 번뜩이는 아이디어를 AI 기술을 활용하여 프로토타입으로 만들어 본 분
  • 업무에 필요한 일본어를 구사할 수 있거나, 일본 시장 대상 AI 서비스 경험이 있는 분




이런 팀 문화에 공감하고 함께하실 분을 찾고 있어요 🔍


  • 주도적으로 문제를 정의하고 의견을 제시하는 분
  • 상대방의 의견을 경청하면서 적극적으로 소통할 수 있는 분
  • 자신이 해야 할 업무에 대해 '왜'를 항상 생각하는 분
  • 결정을 미루지 않고 바로 해결하는 것을 좋아하는 분