Aegis-X — AGI 시대 멀티모달 데이터셋 자동 생성 시스템
재난 / 의료 / 로보틱스 / 방위 / 자동화 — 98 카테고리 × 7 modality 합성 데이터를 24/7 무인 생산
할리우드 VFX·자율주행·휴머노이드·국방 AI 모델 학습에 필요한 대용량 멀티모달 데이터셋을 외부 API 의존 없이 자체 LLM 라우터·확산 모델·시뮬레이션 엔진으로 직접 합성합니다. v5.2.0-S1 기준 1,200+ event 누적, 매일 자동 추가.
현재 상태 (v5.2.0-S1)
재난·의료·로보틱스·방위·자동화 도메인
visual / auditory / haptic / olfactory / sensors / timeseries / text
v5.2.0-S1 기준, 매일 자동 추가
자체 LLM 라우터 + Ollama + 자체 확산 모델
샘플 이미지 — 6 카테고리 (실제 v5.2.0-S1 생산물)
각 이미지는 visual modality 만 표시. 실제 데이터셋은 audio (.wav), haptic (.json), olfactory (.json), sensors (.csv), timeseries (.csv) 자료가 함께 포함됩니다.
왜 Aegis-X 인가?
AGI 학습에는 수십 TB 의 멀티모달 데이터 (visual + auditory + haptic + olfactory + sensors + timeseries + text) 가 필요합니다. 인간이 수집하면 비용은 수백만 달러, 라이선스는 불투명, 한국 도메인 (한국 인물·제복·시설) 은 더욱 부족합니다. Aegis-X 는 이 문제를 자체 IP 로 해결합니다.
특장점
자체 개발 IP — 외부 API 비용 $0
OpenAI/Anthropic/Scale AI 의존 없이 Ollama qwen3:8b + 자체 확산 모델 + 시뮬레이션 엔진으로 합성. v5.0.0 무료 LLM 라우터 6종 (Qwen3-235B + Solar Pro + EXAONE + DeepSeek R1 등) 통합.
98 카테고리 × 7 Modality 통합
재난(지진·화재·홍수), 의료(외상·수술·중환자실), 로보틱스(창고·드론·휴머노이드), 방위(이지스함·미사일·레이더), 스마트팩토리, 자율주행 등 98개 도메인. 각 이벤트는 visual + auditory + haptic + olfactory + sensors + timeseries + text 7-modality 동시 합성.
한국 도메인 최적화
한국인 안면·체형 + 한국 정부 제복 (해군/소방청/응급의료) + 한국 시설 (서울 종합병원/이지스함/스마트팩토리) 정확 묘사. B2G 기관 (방위사업청·해군·소방청·보건복지부 등 13기관) 직접 활용 가능.
물리·검증 통과 보장
각 이벤트는 4 Physics 시뮬레이션 (CFD, Stefan-Boltzmann, Helmholtz, OSHA PEL) + 12 도메인 검증 에이전트 통과. cross-modal coherence + schema-driven 검증으로 일관성 100% 보장. 65 rules pattern + 29 DSL test PASS.
라이선스 명확
CC-BY 4.0 (academic) + Commercial 라이선스 동시 발급. HuggingFace + Kaggle + Zenodo DOI 공식 출판 가능. 사용처 제약 명시.
24/7 무인 자동 진화
Production runner 가 매 사이클 후 autonomous_evolution_v2 1회 실행. 약점 카테고리 자동 보강 + 임계값 자동 조정 + 240명 위인 시뮬레이션 위원회 합의. 사람 개입 없이 데이터 품질·다양성 지속 향상.
시장 경쟁력
기존 합성 데이터 / 어노테이션 서비스 대비 압도적 가격·도메인 우위:
Scale AI 대비
Scale AI 는 수동 어노테이션 + 외부 LLM 의존 → 1,000 event 약 $5,000-$10,000. Aegis-X = 자체 자동화 → 동일 수량 $250-$3,600 (티어별). 가격 1/3~1/20.
Mostly AI / Synthia 대비
Mostly AI 는 정형 데이터 (tabular) 중심 / 1-modality. Aegis-X = 7-modality 동시 합성 + 물리 시뮬레이션. 진정한 멀티모달.
OpenAI Sora / Google Veo 대비
Sora / Veo 는 일반 영상 생성. Aegis-X = 도메인 특화 + 라이선스 명확 + 한국 인물/시설 정확. 학습 데이터로 즉시 활용 가능 (Sora/Veo 는 생성 영상 학습용 라이선스 모호).
B2G 직접 적합
한국 정부 / 방위 / 의료 기관 데이터 수요 = 보안·라이선스·국내 인물 묘사 필수. Aegis-X 는 이 모든 조건 충족 — 13개 한국 정부기관 즉시 도입 가능.
출시 임박 — 사전 알림 받기
Aegis-X 데이터셋은 정식 출시 준비 중입니다. 조기 액세스 / B2G 도입 / 학술 협력 문의는 [email protected] 으로 연락 주세요. 회원가입 후 출시 알림을 받으실 수 있습니다.
Aegis-X 는 GaRangBi AI Tech 의 자체 개발 IP 입니다. v5.2.0-S1 기준 정식 상품화 진행 중 — 출시 일정은 추후 공개됩니다.