주제별 자료/도시

상하이 : 스마트 시티를 넘어선 퀀텀 시티 선언

bus333 2025. 12. 23. 21:57

상하이의 세계관: 스마트시티를 넘어 ‘퀀텀시티’로

 


중국 각 도시의 AI 정책은 상당히 치열한 경쟁 구도를 지니고 있습니다. 그 중에서 가장 리더십을 발휘하는 곳은 단연코 상하이, 이 도시 행정가들을 이해하면 중국AI거버넌스 미래를 예견할 수 있습니다. 


지난 12월 19일 상하이는 스마트시티를 넘어 퀀텀시티로 도약한다는 선언을 했는데요, 그 중심에는 상하이시 기획자원국과 센스타임이 공동 개발한 중국 최초의 기획·자원 분야 파운데이션 모델, ‘운우성공 대형모델 (The Cloud Cosmos Large model, 云宇星空) (프로 버전)’이 있습니다. 이는 지난 7월 발표한 초기 모델의 업그레이드 버전으로 기존 IT기술 기반 스마트시티를 넘어 인공지능이 도시의 물리적·시간적 흐름을 스스로 인지하고 결정하는 ‘퀀텀시티(Quantum City, 양자도시)’로의 대전환을 이야기 합니다.  

 

 


1. 퀀텀 시티의 본질: 6,000억 파라미터의 대형모델 


피지컬 AI 의 도시버전 
• 대형 규모, 전용 코퍼스: 6,000억 파라미터의 모델은 중국 최초의 기획·자원 분야 전용 *코퍼스인 ‘곤여경략(坤舆经略)’을 기반으로 학습. 텍스트를 넘어 국토 공간 기획의 복잡한 규칙과 자연 자원 체계의 진화 과정을 깊이 있게 이해합니다.


• ‘1+6+N’ 모델 체계: 1개의 강력한 파운데이션 모델을 중심으로 6개의 버티컬 전문 모델이 유기적으로 결합, 그 위에서 다수의 Agent들이 과제 수행


• 5대 핵심 기능
1) 문답: 900권 이상의 전문 문서와 10만 개 이상의 문답 데이터 기반
2) 지도 호출: 자연어로 2·3차원 지도와 실경 사진을 호출
3) 통계 및 연산: 시스템과 직접 연동되어 토지 및 건축 데이터를 실시간으로 분석하고 공간상에 시각화
4) 도면 인식: 복잡한 설계도면에서 핵심 공간 요소를 스스로 추출하고 규정 준수 여부를 검토
5) 보고서: 업무 로직과 기술 규범을 이해하여 도시 정책 사업 보고서 생성

 

"*코퍼스(corpus)"란 AI나 자연어 처리(NLP) 분야에서 쓰이는 전문 용어예요. 쉽게 말하면:

  • 대량의 텍스트 데이터 모음을 뜻해요. 책, 기사, 대화, 웹 페이지 등 실제로 쓰인 언어 자료를 모아놓은 "말뭉치"죠.
  • AI(특히 대형 언어 모델, LLM)를 훈련시킬 때 이 코퍼스를 기반으로 학습해요. 모델이 언어를 이해하고 생성할 수 있게 해주는 "교과서" 같은 거예요.

예를 들어:

  • 일반 코퍼스: 인터넷 전체 텍스트나 책 수억 권을 모은 거 (ChatGPT 같은 모델이 이런 걸로 학습).
  • 전용 코퍼스: 특정 목적이나 도메인(분야)에 맞춰 따로 만든 데이터셋. 더 정확하고 전문적인 AI를 만들기 위해 사용해요.

임선영 씨 포스트에서 말한 ‘곤여경략(坤舆经略)’은 아마 퀀텀시티 관련 AI 시스템의 전용 코퍼스 이름일 거예요. (중국어로 된 프로젝트나 모델 이름처럼 보이는데, "坤舆"는 땅이나 세계를 뜻하는 고전 용어고, "经略"은 전략·경영을 의미해요. 전체적으로 "세계 전략" 같은 뉘앙스?)

이 전용 코퍼스를 기반으로 한다는 건, 일반 데이터가 아닌 퀀텀 기술, 도시 계획, AI 미래 등 특화된 자료로 학습된 AI를 의미할 가능성이 커요. 그래서 상하이의 퀀텀시티 비전이 더 구체적이고 전문적으로 구현된다는 뜻이죠!

 



2. 멀티모달 ‘도시파운데이션모델’ 

 

이 모델은 범용 모델을 파인튜닝한 것이 아니라 고품질 ‘텍스트-이미지-공간’ 삼원색 코퍼스를 기반으로 구축된 전문가급 멀티모달 월드 **파운데이션 모델입니다.

 

• 공간 의미 정렬: 자연어 인풋으로 (예: 용적률 2.5 이하), 2차원 도면(CAD, GIS), 3차원 실경(점구름 등)을 통일된 의미 공간에서 정렬하여 ‘언어-시각-기하’의 삼중 이해를 구현합니다.
• 산업 전문 데이터 학습: 규정 및 법규 라이브러리, 역사적 심의 사례, 도시 계획 표준 등 전문 지식 그래프를 훈련을 강화하여 통계적 연관성 나열이 아니라 추론하는 결과를 내놓습니다.  
***멀티모달 정렬 아키텍처: 도시 계획 도면의 범례, 위상 관계, 좌표계 등에 최적화된 사전 학습을 통해 범용 파운데이션 모델의 한계를 극복합니다. 
• 기술적 함의: 중국 국토 공간 거버넌스 분야에서 최초로 전과정(Full-link) AI 인지-의사결정의 AI화를 실현했으며 언어 중심에서 ‘공간+언어+데이터’ 멀티모달 인지체로의 진화를 의미합니다.

 

**파운데이션 모델(Foundation Model)은 AI 분야에서 최근 많이 쓰이는 용어예요. 쉽게 풀어서 설명하면:

  • 기본 뜻: AI의 "기초 모델" 또는 "범용 기반 모델"이에요. 집을 지을 때 **튼튼한 기초(foundation)**를 먼저 만들고, 그 위에 벽·지붕 등을 올리듯이, 이 모델은 엄청난 양의 데이터로 미리 학습된 거대한 AI예요. 이걸 바탕으로 다양한 구체적인 작업(앱·서비스)을 쉽게 만들 수 있어요.
  • 주요 특징:
    • 대규모 데이터로 사전 학습: 인터넷 텍스트, 이미지, 코드 등 방대한 데이터를 사용해 학습해요. (보통 레이블 없이 자기 지도 학습 방식)
    • 범용성: 하나의 모델로 텍스트 생성, 번역, 이미지 만들기, 코드 작성, 질문 답변 등 다양한 일을 할 수 있어요.
    • 미세 조정(fine-tuning): 기본 모델을 특정 분야(예: 의료, 법률)에 조금만 더 학습시키면 전문 AI로 변신해요. 처음부터 새로 만드는 것보다 훨씬 빠르고 저렴!
  • 대표 예시:
    • GPT 시리즈 (ChatGPT의 기반): 텍스트 기반 대형 언어 모델(LLM).
    • BERT: 검색·이해에 강함.
    • DALL-EStable Diffusion: 텍스트로 이미지 생성.
    • 요즘 생성 AI(Generative AI)의 대부분이 이 파운데이션 모델을 기반으로 해요.

이 개념은 2021년 스탠포드 대학 연구에서 처음 제안됐어요. 기존 AI가 "특정 일만 잘하는 전문가"였다면, 파운데이션 모델은 "다재다능한 만능 엔터테이너" 같은 거죠!

이전 대화에서 퀀텀시티 관련해서 나온다면, 중국 상하이 프로젝트에서 이런 파운데이션 모델을 양자 기술·도시 데이터에 특화해서 사용하려는 맥락일 수 있어요. (전용 코퍼스로 학습된 초대형 기반 AI)

 

 

 

***멀티모달 정렬 아키텍처(Multimodal Alignment Architecture)***라는 조금 어려운 말을 아주 쉽게 풀어서 설명해드릴게요!

먼저 배경: 왜 이런 게 필요할까?

보통 파운데이션 모델(예: ChatGPT, Gemini 같은 대형 AI)은 주로 텍스트로 학습됐어요. 그래서 글은 엄청 잘 이해하지만, 이미지·도면·지도·그래프 같은 시각 자료는 상대적으로 덜 잘 이해해요.

특히 도시 계획 도면은 더 어려워요. 왜냐면:

  • 단순한 사진이 아니라 범례(기호 설명), 위상 관계(건물과 도로가 어떻게 연결돼 있는지), 좌표계(실제 지도 좌표) 같은 전문적인 정보가 가득하거든요.
  • 일반 AI는 이런 도면을 봐도 “아, 예쁜 그림이네” 정도로만 이해할 수 있어요. 실제 의미(이 건물은 어디에 있고, 이 도로는 어떻게 연결되는지)는 잘 못 파악해요.

멀티모달 정렬 아키텍처가 하는 일

  • 멀티모달 = 여러 형태의 데이터(텍스트 + 이미지 + 숫자 + 좌표 등)를 동시에 이해하는 능력.
  • 정렬(Alignment) = 텍스트 설명과 이미지·도면의 의미를 정확하게 짝짓기하는 과정. 예: “이 빨간 선은 고속도로야”라는 텍스트와 도면 속 빨간 선을 AI가 정확히 연결짓게 만드는 거예요.

이 아키텍처는 도시 계획 도면에 특화된 사전 학습을 해요. 즉:

  • 수많은 실제 도시 계획 도면, 범례, 지도 데이터 등을 미리 학습시켜서
  • AI가 도면을 볼 때 범례를 자동으로 해석하고, 건물 간 거리·연결 관계를 이해하고, 좌표를 정확히 읽어내게 만듦.

결과적으로 얻는 효과

  • 범용 파운데이션 모델의 한계 극복:
    • 일반 AI → 도면을 보여주면 “이건 도시 지도 같아요” 정도로 끝.
    • 이 특화 아키텍처 AI → “이 도면에서 A건물과 B건물 사이 거리는 1.2km이고, 고속도로로 직접 연결돼 있으며, 좌표는 (31.2, 121.5)예요. 이 지역은 상업지구로 지정됐어요”처럼 정확하고 전문적으로 분석 가능.

쉽게 비유하면:

  • 일반 AI는 외국어를 겨우 알아듣는 초보자라면,
  • 이 멀티모달 정렬 아키텍처는 도시 계획 전문가 수준으로 도면을 읽는 통역사예요.

상하이 퀀텀시티 프로젝트에서 이런 기술을 쓰면, AI가 도시 전체의 복잡한 계획 도면을 완벽하게 이해하고 실시간으로 최적화된 도시 설계를 제안할 수 있게 되는 거죠. SF 영화 속 초지능 도시가 현실로 다가오는 핵심 기술 중 하나예요!

 

________________________________________


3. ‘공간 지능(Spatial Intelligence)’의 기술적 구현

 

이 모델은 3차원 공간 관계 이해로의 업그레이드를 명확히 하고 센스타임의 ****SenseNova-SI 공간 지능 모델을 기반으로 합니다.

 

• 3차원 장면 재구성 및 이해: 다각도 영상 또는 LiDAR 데이터를 바탕으로 건축물, 도로, 녹지 등의 기하 및 의미 모델을 자동 재구성
• 공간 관계 추론: 지형지물 식별을 넘어 안전 거리 규범 위반 여부 등을 논리적으로 추론
• 공간 측정 및 합법성 검증: 건축물 간격, 녹지율 등을 자동 계산하여 자동화된 심사를 지원
• 동적 공간 시뮬레이션: 인류, 차류 데이터와 결합해 보행 친화성이나 열섬 현상 등 공간 사용 효능을 예측
• 기술적 함의: 평면 정보 처리를 넘어 물리 세계의 3차원 위상과 기능 로직을 이해하는 단계로 도약했으며 이는 ‘디지털 트윈 시티’와 ‘퀀텀 시티’를 향한 핵심적 진전입니다.

 

 

****센스타임(SenseTime)의 SenseNova-SI 공간 지능 모델은 중국 AI 기업 센스타임의 SenseNova(日日新) 대형 모델 시리즈 중 하나로, 공간 지능(Spatial Intelligence)에 특화된 멀티모달 AI 모델이에요. 2025년 11월에 정식 출시되고 오픈소스로 공개됐어요!

쉽게 말하면 어떤 모델일까?

  • 일반 AI(예: ChatGPT, Gemini)는 텍스트나 평면 이미지를 잘 이해하지만, 3D 공간을 제대로 파악하는 데 약해요. 예를 들어:
    • 물체의 거리·위치·관계 (앞/뒤, 왼쪽/오른쪽)
    • 다른 각도에서 본 모습 상상 (perspective-taking)
    • 공간 왜곡이나 조립, 거리 측정 등
  • SenseNova-SI는 바로 이 공간 이해와 추론을 엄청나게 강화한 모델이에요. 이미지나 도면을 보고 "이 건물은 저 건물보다 500m 뒤에 있고, 오른쪽으로 이동하면 이렇게 보일 거야"처럼 3D 세계를 머릿속으로 시뮬레이션할 수 있게 해줘요.

주요 특징

  • 모델 크기: 2B(20억 파라미터)와 8B(80억 파라미터) 두 버전. (가벼워서 실사용하기 좋음)
  • 훈련 비결: 800만 개의 대규모 **공간 특화 데이터(SenseNova-SI-8M)**로 학습. 공간 능력을 6가지 카테고리로 분류해서 균형 있게 훈련했어요. (데이터 양 늘릴수록 성능이 폭발적으로 오르는 "스케일링 법칙"을 공간 분야에서 처음 증명!)
  • 성능: 여러 벤치마크에서 오픈소스 모델 중 최고, 심지어 GPT-5나 Gemini 2.5 Pro 같은 폐쇄형 최신 모델도 넘어섰다고 해요. (평균 점수 60점대 vs. 경쟁 모델 40~50점대)

왜 중요한가? (퀀텀시티와 연결해서)

이전 대화에서 상하이 퀀텀시티 프로젝트가 도시 계획 도면, 위상 관계, 좌표 등을 AI가 완벽히 이해해야 한다고 했죠? SenseNova-SI는 바로 그 한계를 극복하는 기술이에요.

  • 도시 도면·지도·3D 모델을 정확히 해석
  • 건물 배치, 교통 흐름, 공간 최적화 등을 초정밀하게 시뮬레이션
  • 자동운전, 로봇, 스마트시티, 건축 설계 등 실생활 적용에 딱!

쉽게 비유하면: 일반 AI가 "평면 지도만 보는 사람"이라면, SenseNova-SI는 3D 안경 쓰고 실제 도시를 날아다니며 보는 슈퍼맨 같은 느낌이에요. 센스타임이 이걸 오픈소스로 풀었으니, 전 세계 개발자들이 더 발전시킬 수 있을 거예요!


________________________________________

 

4.  AI 에이전트(AI Agent) 역량

 

• 작업 분해 및 스케줄링: “특정 구역 갱신 잠재력 분석” 입력 시, 현황도 호출 → 노후 건축물 추출 → 제어 기획 중첩 → 용적률 여량 평가 → 보고서 생성의 과정을 자동 분해하여 실행합니다.
• 에이전트 호출 능력: GIS 플랫폼, 통계 데이터베이스 등과 연동되어 ‘AI 명령 → 시스템 조작 → 결과 회신’의 폐쇄 루프를 실현합니다.
• 규범 기반 생성: 전문 기술 규범에 부합하는 형식과 용어로 보고서를 출력합니다.
• 기술적 함의: AI가 단순한 에이전트가 아닌 도시 행정의 능동적 수행자로 작동합니다. 
________________________________________

 

5. 시공간 거버넌스 모델을 최초로 가동 

 

상하이시 기획자원국 주도의 이 모델은 명확한 공공 거버넌스 속성을 지니며 기술 배포 측면에서 중요한 의미

 

• 거버넌스 AI 신모델 제시: 미래의 도시 계획, 용지 심의, 위법 건설 식별 등이 이 모델을 바탕으로 표준화·자동화
• 민관 협력 혁신 모델: 정부의 엄선된 데이터와 기업(센스타임)의 모델이 결합된 새로운 디지털 인프라 패러다임을 제시
• 자국내 공간 지능 생태계: 서구권 기술 스택에서 독립된 독자적인 공간 지능 기술 스택을 구축하는 과정
________________________________________

 

6. 전략적 확장: ‘퀀텀 시티’와 ‘AI for Science’의 초석

 

여기서 ‘퀀텀(양자)’은 물리적 양자가 아니라 고차원적이고 동적이며 계산 가능한 도시 시스템을 비유합니다. 이는 과학적 연구 플랫폼으로서의 도시를 재정의하며 도시를 복잡계로 간주하여 AI를 통한 인과 추론 및 정책 시뮬레이션을 수행, 미래의 과학기술 개발에 기여하도록 설계되어 있습니다. 또한 향후 출시될 드론택시, 휴머노이드, 자율주행차 등 피지컬 AI를 효율적으로 작동하게 하는 인프라 스트럭쳐가 됩니다.

 

 

 

 

 

출처 : 임선영 님의 FB

https://www.facebook.com/seonyoung.im.10/posts/pfbid0254AG4RuGriHNoFK37aesuFRbTiLNbmwm88X4VY3jiCUrHHvySht6Q5iMp4bqdFLdl

 

 

임선영

#중국AI미래지도 상하이의 세계관: 스마트시티를 넘어 ‘퀀텀시티’로 중국 각 도시의 AI 정책은 상당히 치열한 경쟁 구도를 지니고 있습니다. 그 중에서 가장 리더십을 발휘하는 곳은 단연코 상

www.facebook.com

 

 

 

 

상하이 퀀텀 시티 설명

https://ghzyj.sh.gov.cn/tpxw/20250107/a6eef59fd9f0477c9b6d4a1ba1edd15b.html

 

城市治理从“精细”进阶到“量子”,拢共分几步?_上海市规划和自然资源局

城市治理从“精细”进阶到“量子”,拢共分几步? 2025年01月07日 雄大设计   互联网还在调侃“遇事不决,量子力学”,上海已经进入了“空间治理,量子城市”。什么是“量子城市”?“

ghzyj.sh.gov.cn