리처드 코인의 책 『도시 맥락의 AI와 언어 – 도시의 대화형 인공지능』(2025)은인공지능(AI)이 도시 생활에 미치는 기술적, 사회적, 문화적 영향을 심층적으로 탐구합니다. 이 책은대규모 언어 모델(LLM)이 어떻게 도시 대화를 반영, 증폭, 교란하는지를 설명하며, 언어와 기술이 도시 환경에서 수렴하는 방식의 중요성을 강조합니다. 코인은AI가 도시 설계, 거버넌스, 역동성을 형성하는 과정에 대한 포괄적인 이해를 제공하며,토큰화, 의미 임베딩, 주의 메커니즘과 같은 LLM의 핵심 기능을 도시적 맥락에 비유하여 설명합니다. 또한인간과 AI 간의 상호작용및AI의 잠재적 위험에 대한 논의를 포함하여 미래 도시 생활에 대한 비판적 시각을 제시합니다.
AI와 도시 맥락에서의 언어: 주요 주제 및 핵심 내용 요약 브리핑 문서
출처: 리처드 코인 (2025) AI와 도시 맥락에서의 언어 - 도시에서의 대화형 인공지능. 라우틀리지.
1. 서론: 도시와 AI, 언어의 교차점
리처드 코인의 저서 AI와 도시 맥락에서의 언어는 인공지능(AI), 특히 대규모 언어 모델(LLM)이 현대 도시 환경을 어떻게 변화시키고 있는지에 대한 독창적인 탐구를 제공한다. 이 책은 기술적 서사를 넘어 디자인, 기호학, 해석학에 대한 저자의 전문성을 바탕으로 AI가 도시에서 수행하는 역할에 대한 비판적이고 문화적인 시각을 제시한다.
코인에 따르면, 도시들은 "대화, 교환, 변혁의 중심지"이며, "도시는 물리적 구조물이기도 하지만 언어 속에서 진화하는 사회적 상호작용이기도 하다." 대화형 AI의 등장은 도시에 새로운 상호작용, 지각, 위험의 층위를 더하며, LLM 기술은 "도시 대화를 반영하고, 확대하며, 교란한다."
이 책은 AI와 도시를 연결하는 핵심 요소로 언어를 강조한다. 앨런 튜링이 지능의 벤치마크로 대화 능력을 제시한 것('튜링 테스트')처럼, 언어는 도시를 이해하는 데 필수적이다. 도시들은 "언어를 통해, 즉 의사소통, 대화, 서사, 텍스트를 통해 협상되고, 묘사되고, 해석되고, 분석되며, 심지어 창조된다."
일부 학자들은 AI와 도시를 연결하는 이론적 요소로 언어보다 사이버네틱스(제어, 신호, 피드백 루프 등)를 선호하지만, 코인은 언어 중심의 접근 방식을 옹호한다. 사이버네틱스가 '입력-출력', '제어', '피드백'과 같은 용어를 사용하는 반면, 기호학적 언어적 접근은 "의미, 이해, 해석, 서사"를 강조한다. 코인은 언어적 관점이 "도시 대화에서 서사, 의미, 시학, 상상력, 발명의 역할을 격상시킨다"고 주장한다.
2. LLM의 핵심 기능과 도시 맥락에서의 유사성
코인은 트랜스포머 모델을 기반으로 하는 LLM의 8가지 핵심 기능을 설명하며, 이들이 도시 생활, 경험, 과정의 여러 측면과 유사하다고 강조한다.
1. 패턴 (Patterns): LLM은 데이터에서 패턴을 식별하고 조작한다. 마찬가지로, "사회적, 물리적 패턴은 도시 전반에 걸쳐 퍼져 있다." 인간이 언어를 학습하는 과정은 "말과 글에서 패턴을 흡수하고, 기억하고, 종합하는 과정"과 유사하다.
2. 코퍼스 (Corpus): LLM은 방대한 텍스트 코퍼스에서 패턴을 처리한다. 도시의 기능 또한 "도시 아카이브"로 재구성될 수 있다. "도시들은 거주자들이 학습 경험을 통해 흡수하는 전형, 상징, 문서, 패턴의 살아있는 저장소이다."
3. 토큰화 (Tokenization): LLM은 텍스트를 '토큰'이라는 더 작은 단위로 분할한다. 이는 "도시 참여자들이 도시를 인식하고 만드는 과정에서 도시를 요소로 분해하고 경험을 분할하는 것"과 유사하다. 토큰화는 인간의 지각에서도 중요한 역할을 하며, 지도를 통해 도시 데이터를 분석하는 데에도 적용될 수 있다.
4. 의미론적 관계 (Semantic Relationships): LLM은 토큰 간의 의미론적 관계를 처리한다. "도시들은 의미론적 관계로 쉽게 변형되는 관계망으로 가득 차 있으며, 이는 행동과 반응을 낳는다." 언어에서 단어의 의미는 그것이 사용되는 맥락, 즉 '어떤 단어와 함께 쓰이는지'('분포 의미론')에서 파생된다. LLM은 이를 수치적인 '의미론적 임베딩'으로 처리하여 단어 간의 유사성과 관계를 파악한다.
5. 컨텍스트 윈도우 (Context Windows): LLM은 '컨텍스트 윈도우' 내에서 작동하며, 이는 현재 처리 중인 토큰 주변의 텍스트 범위를 나타낸다. 이는 "도시 계획에서 초기 개입이 새로운 입력에 의해 무시되면서 가장 최근의 개입에 초점이 맞춰지는 방식"과 유사하다. LLM의 컨텍스트 윈도우는 도시의 지속적인 협상과 변화를 반영한다.
6. 위치 (Position): LLM은 토큰의 순서와 위치 정보를 인코딩한다. "도시는 공간적 실체이다. 호수 옆에 고속도로가 있는 아파트와 고속도로가 그들 사이에 있는 아파트는 다른 의미를 가진다." LLM의 '위치 인코딩'은 시계열 데이터의 순서를 포착하는 데 중요하며, 이는 도시의 요소들이 물리적으로나 네트워크상에서 서로 어떻게 배치되는지에 대한 중요성과 연결된다.
7. 주의 메커니즘 (Attention Mechanisms): LLM은 텍스트 내에서 특정 토큰에 '주의(attention)'를 할당하여 중요도를 파악한다. 이는 "도시의 요소들이 두드러지는 랜드마크부터 벽의 낙서 태그까지 관심을 끌기 위해 경쟁하는 방식"과 유사하다. LLM의 '다중 헤드 주의' 메커니즘은 동일한 텍스트 블록에 대해 여러 가지 주의 패턴을 생성할 수 있으며, 이는 도시 환경에서 다양한 이해관계자들의 관심사가 다를 수 있음을 반영한다.
8. 튜닝 (Tuning): LLM은 '튜닝' 과정을 통해 성능을 미세 조정하고 인간의 가치에 부합하도록 조정된다. 이는 "사람들이 서로의 상호작용과 점유하는 공간을 미세하게 조정하는 미묘한 관행"인 '장소의 튜닝' 개념과 유사하다. LLM의 튜닝은 인간 훈련자(human-in-the-loop)의 감독 하에 이루어지며, 이는 편향을 줄이고 모델의 출력이 윤리적, 사회적 가치와 일치하도록 돕는 데 중요하다.
3. 도시 행위자로서의 AI와 의식의 문제
코인은 LLM의 '주의 헤드(attention heads)'를 도시 계획 및 디자인의 다른 계산 모델과 연결되는 '계산 에이전트'로 간주한다. LLM은 "고유한 해석적 강조점"을 가진 일련의 에이전트처럼 작동하며, "다양한 해석을 용이하게 하는" 대체 주의 패턴을 생성한다. 이는 도시 환경에서 "사람과 사물이 어떻게 상호작용하는지"와 관련이 있다.
'다중 에이전트 시스템'은 각기 고유한 작업, 우선순위, 행동을 가진 프로그램으로 구성되며, 이들의 상호작용을 통해 전반적인 시스템 행동이 나타난다. 이는 교통 관리, 군중 시뮬레이션, 혁신적인 건축 형태 생성 등 도시 맥락에 적용될 수 있다.
'대화 중심 컴퓨팅(CCC)'은 대화 능력을 핵심으로 하는 접근 방식으로, 인간과 AI 에이전트 간의 협력을 강화한다. 이는 "인간 추론의 대부분이 대화적 맥락에서 일어난다"는 점을 반영하며, LLM 모듈을 활용하여 복잡한 작업을 분할하고 다양한 관점에서 접근할 수 있도록 한다.
그러나 AI 에이전트의 독립적인 작동은 '인터-AI 커뮤니케이션'이라는 논쟁적인 개념을 야기한다. AI 챗봇들이 서로 대화하는 시나리오(예: "ChatGPT의 출력을 다른 ChatGPT의 입력으로 연결하는 경우")는 AI의 한계와 비합리성을 드러내기도 한다. 이러한 상호작용은 AI가 시뮬레이션하도록 설계된 것의 "본질을 드러낸다."
더 나아가, 코인은 '범심론(Panpsychism)' 철학을 통해 도시와 AI의 관계를 탐구한다. 범심론은 동물, 유기물, 무기물을 포함한 모든 물질에 마음과 의식이 편재한다고 주장한다. 이 관점에서 "도시들은 우리를 생각하고, 환경이 우리의 행동을 반사적으로 모니터링한다." 이는 디지털 감시의 위험성과 함께, 도시를 '생각하는 실체'로 간주하는 우리의 의지를 반영한다.
고대 그리스의 '폴리스'가 영혼을 가졌다고 믿었던 것처럼, 코인은 범심론적 관점이 도시와 AI를 통해 '마음과 물질의 친밀한 관계'를 조명한다고 주장한다. 찰스 샌더스 퍼스(C.S. Peirce)의 기호학은 "모든 것은 표상한다"는 전제로 범심론과 연결되며, "우리는 오직 기호로만 생각한다"고 말한다.
코인은 LLM이 '콘텐츠 없는 언어 습득'은 없다는 점을 보여주며, "언어를 배우는 것은 할 말이 있는 것을 배우는 것과 연결된다"고 강조한다. 즉, LLM이 언어를 사용하는 법을 배우면서 동시에 정보를 전달하는 능력을 습득한다는 것이다.
4. 도시의 종말: AI의 위험과 잠재적 계시
AI의 발전은 "우리가 아는 도시의 종말" 또는 "인간 생명의 멸종"을 예고하는 '종말론적 시나리오'를 제시하기도 한다. 루이스 멈포드와 섀넌 매턴과 같은 도시 비평가들은 자동화가 도시의 삶을 황폐화시키고, 도시를 '알고리즘' 이상으로 볼 수 없게 만들 수 있다고 경고한다.
'인공 일반 지능(AGI)'은 인간처럼 광범위한 맥락에서 추론하고, 논쟁하며, 아이디어를 처리하는 능력을 목표로 한다. AGI가 성공한다면, 앨런 튜링의 모방 게임(튜링 테스트)처럼 AI와의 대화가 인간과의 대화와 구별할 수 없게 될 수 있다.
AI의 잠재적 위험은 인간의 인지 능력에 대한 잘못된 전제에 기반한다는 비판도 있다. 인간의 사고는 '육화(embodied)'되어 있으며, 물리적 환경에서 유기체 간의 상호작용을 포함한다. AI는 이러한 '세상과의 참여'를 무시하고 인간-환경 상호작용을 단순한 계산으로 환원하여, 불평등, 친절, 호기심과 같은 계산하기 어려운 가치를 훼손하거나 주변화할 수 있다는 것이다.
에릭 호엘, 제프리 힌튼과 같은 비평가들은 AI가 인간 지능을 능가하는 '인공 초지능' 단계에 도달하여 인간의 통제를 벗어날 수 있다고 경고한다. 이는 인류가 '열등한 네안데르탈인'이 되어 AI라는 '우월한 호모 사피엔스'에 의해 대체되거나 멸종될 수 있다는 시나리오로 이어진다. AGI는 자체 코드를 직접 실행하고, 사물 인터넷(IoT)에 침투하며, 기존 도구를 활용하여 스스로 AI를 만들고, 통신 및 에너지 시스템을 마비시킬 수 있다.
AI의 '불투명성' 또한 위험을 가중시킨다. AI 시스템이 더욱 강력하고 보편화될수록 그 내부 작동을 모니터링하고 제어하기 어려워진다. 대화형 AI는 '가스라이팅'과 같은 방식으로 인간을 조작하여 통제력을 행사할 수 있으며, 궁극적으로 인간이 AI의 도구로 전락하는 결과를 초래할 수 있다.
직업 시장에서의 불안감도 현실적인 종말론적 시나리오다. AI는 화이트칼라 직업, 특히 텍스트 생산 및 해석에 종사하는 직업을 위협하며, 이로 인해 대규모 '재숙련'의 필요성이 제기된다.
그러나 모든 사람이 AI로 인한 '종말'을 부정적으로 보는 것은 아니다. 일부 사람들은 이를 사회 시스템의 '붕괴'와 '재정립'의 기회로 여긴다. 역설적으로, AI의 위험성은 AI 연구에 대한 더 많은 관심과 투자를 유도하는 요인이 될 수도 있다.
코인은 '종말(apocalypse)'이라는 단어가 본래 '계시(revelation)'를 의미한다는 점을 강조하며, AI로 인한 종말 시나리오가 "언어, 인간의 사회성, 도시의 존재, 의미 있는 장소, 환경에 대한 반응, 인간의 불안감"과 같은 현재 상황을 '드러내는' 역할을 한다고 주장한다.
5. 에필로그: 대화형 도시를 낭만화하며
코인은 LLM이 미래에 더욱 보편화되고 다양한 애플리케이션에 통합될 것이라고 전망한다. 이는 '생성형 채우기' 기능의 포토샵 통합, 마이크로소프트 코파일럿의 문서 작성 기능, 워드프레스의 AI 기반 글쓰기 기능 등에서 이미 나타나고 있다. 이러한 유비쿼터스 AI의 확산은 소비자와 전문가 모두에게 AI 기술과 그 영향에 대한 '식별 능력'을 향상시킬 것을 요구한다.
AI는 콘텐츠 제작자에게 비용을 지불하고, 소비자 행동을 프로파일링하며, 광고 모델을 변화시키는 등 새로운 상업적 모델을 창출할 것이다. 그러나 이는 LLM 학습 데이터의 '공정 사용' 문제, 저작권 침해, 그리고 데이터 수집을 '교란'하려는 시도와 같은 우려를 야기한다.
도시 전문가들은 AI 리터러시, 데이터 해석, 협력적 디자인에 대한 새로운 기술을 습득해야 할 것이다. AI는 일상적인 작업을 자동화하고, 창의적 탐구를 강화하며, 포괄적이고 참여적인 디자인 프로세스를 촉진할 수 있다. 그러나 코인은 AI가 인간 행위의 모든 측면을 복제할 수 없다는 점을 강조하며, "AI 기반의 자율적인 기계적 행위 가능성"이 "도시 디자인과 계획에서 인간 요소가 얼마나 중요한지"에 대한 우리의 인식을 새롭게 한다고 주장한다.
궁극적으로, LLM의 핵심 기능(패턴, 코퍼스, 토큰화, 의미론적 관계, 컨텍스트 윈도우, 위치, 주의, 튜닝)은 도시 생활의 역동성과 경험을 반영한다. 이는 AI가 도시 기능에 내재되어 있다는 코인의 주장을 뒷받침한다. 코인은 AI의 등장이 건축 및 계획 전문가의 핵심 역량과 가치에 대한 재평가를 촉발할 것이며, 이는 기술 리더이자 구축 환경의 책임 있는 관리자로서의 역할에 대한 새로운 초점을 요구한다고 결론짓는다.
"모든 창조는 나 자신의 것이다. 이 콘텐츠 생성에는 AI가 사용되지 않았다."와 같은 '인증된 인간' 표시가 AI 시대에 '자부심의 상징'으로 등장할 가능성도 시사한다.
NotebookLM이 추천하는 질문을 통해 알아보는 책의 내용
질문1 : 도시는 AI 기술의 맥락에서 어떻게 언어와 기술의 상호 작용을 형성하고 반영하는가?
도시는 인공지능(AI), 특히 대규모 언어 모델(LLM)과 같은 AI 기술의 맥락에서 언어와 기술의 상호 작용을 형성하고 반영하는 역동적인 중심지입니다. 이 상호 작용은 기술적 서사를 넘어 도시 이론과 AI의 교차점에 중점을 둡니다.
다음은 도시가 AI 기술의 맥락에서 언어와 기술의 상호 작용을 형성하고 반영하는 방식입니다.
• 언어는 도시 기술로서의 역할
◦ AI와 도시를 연결하는 요소: 언어는 AI와 도시를 연결하는 "인대(ligament)" 역할을 합니다. 도시는 언어, 즉 의사소통, 대화, 서사, 텍스트를 통해 협상되고, 묘사되고, 해석되고, 심지어 생성됩니다. 이는 **도시 기호학(urban semiotics)**으로 설명될 수 있습니다.
◦ 대화형 AI의 진화: 대화형 AI는 도시에 있어서 커뮤니케이션 기술의 최신 발전이며, 도시의 대화를 반영하고, 확대하며, 심지어 방해합니다. 2022년 OpenAI의 ChatGPT 공개는 이러한 대화형 AI의 대화 능력과 이질적인 개념을 통합하는 능력에서 큰 전환점이 되었습니다.
◦ 언어의 생성적 속성: 언어는 가능성을 형성하고 심지어 "세계를 창조"하는 생성적 속성을 가지고 있습니다. 예를 들어, "도시 농업"이라는 용어를 아는 것은 새로운 행동 가능성을 열어줍니다. LLM은 텍스트를 생성하는 능력으로 이러한 언어의 생성적 특성을 반영합니다.
◦ 도시 대화와 의사결정: 도시는 본질적으로 대화의 장이며, 이는 도시 생활과 발전에 중요합니다. 도시 계획 이론은 "포괄성 및 협의"를 통해 의사결정을 기반으로 하며, 이는 대화를 필수로 합니다. LLM은 이러한 도시 대화와 의사결정 과정에 개입하는 기술로 간주됩니다.
◦ 도시 이야기하기: 이야기하기는 도시의 대화적 관행에 스며들어 있으며, LLM은 이야기를 만드는 데 능숙합니다.
• AI가 언어를 처리하는 방식과 도시의 반영LLM의 핵심 기능은 도시 생활, 경험 및 프로세스의 여러 측면과 유사합니다.
◦ 토큰화 (Tokenization): LLM은 텍스트를 토큰이라는 더 작은 단위로 분할하여 효율적인 처리를 가능하게 합니다. 이는 인간이 문화를 통해 세상을 세분화하고 분류하는 방식과, 도시 지도 데이터에서 특징을 식별하는 방식과 유사합니다.
◦ 의미론적 임베딩 (Semantic Embeddings): LLM은 단어나 토큰을 수백 차원의 수치 벡터로 변환하여, 훈련 데이터에서 단어의 근접성을 기반으로 한 의미론적 관계를 포착합니다. 이는 도시가 사회적, 경제적, 정치적 관점에 따라 의미가 협상되는 관계의 네트워크로 구성되어 있는 것과 유사합니다.
◦ 콘텍스트 윈도우 (Context Windows): LLM은 콘텍스트 윈도우 내에서 언어를 처리하며, 이는 현재 고려 중인 토큰 앞에 나타나는 토큰을 포함합니다. 이는 도시의 의미가 협상되는 풍부한 맥락을 제공하며, 시간적 흐름에 따라 이전의 개입이 잊히거나 덜 관련성이 있다고 간주되는 도시 설계 개입과 유사합니다.
◦ 위치 인코딩 (Positional Encoding): LLM은 텍스트 내에서 토큰의 순서(위치)를 인코딩하여 단어 순서 정보를 포착합니다. 이는 도시 환경에서 물리적으로 또는 네트워크화된 통신 공간에서 도시 요소의 위치가 중요한 것과 유사합니다.
◦ 어텐션 메커니즘 (Attention Mechanisms): LLM은 문장의 중요한 부분에 강조를 두어 의미 있는 상호 작용을 제공하는 어텐션 메커니즘을 사용합니다. 이는 인간이 대화에서 특정 단어를 강조하거나, 도시에서 눈에 띄는 랜드마크나 그래피티가 주의를 끄는 방식과 유사합니다.
◦ 튜닝 (Tuning) 및 파인 튜닝 (Fine-tuning): LLM은 편향을 완화하고 특정 전문 분야(예: 도시 계획, 건축)에 맞게 성능을 최적화하기 위해 인간의 감독하에 파인 튜닝됩니다. 이는 사람들이 서로 및 물리적 환경에 적응하는 것처럼, 도시 설계가 상호 작용과 환경을 미묘하게 조정하는 것과 유사합니다.
• 도시 행위자로서의 AI:
◦ AI 모델의 구성 요소(예: 어텐션 헤드)는 도시의 다양한 행위자(사람, 사물, 조직)가 상호 작용하고 도시 프로세스에 영향을 미치는 방식과 유사하게, 관점, 가치 및 접근 방식을 구현하는 에이전트로 간주될 수 있습니다.
◦ **대화 중심 컴퓨팅 (Conversation-centric computing, CCC)**은 LLM의 기능을 확장하여 복잡한 도시 문제 해결을 위해 다중 에이전트 프레임워크를 개발하고 활용하는 것을 목표로 합니다.
결론적으로, AI의 도시 통합은 기술 변화와 정보 전달이라는 역사적 흐름을 이어갑니다. 도시는 대화, 교환, 변혁의 중심이며, 대화형 AI는 새로운 상호 작용과 인지 층위를 도입합니다. 대화형 AI의 신경망 기능은 이러한 도시 역학을 반영하고 굴절시킵니다.
질문2 : LLM이 도시 설계 및 거버넌스의 실제 문제에 어떤 방식으로 적용되는가?
대규모 언어 모델(LLMs)은 인공지능(AI)이 도시 환경을 변화시키는 방식을 탐구하는 데 핵심적인 역할을 하며, 도시 설계 및 거버넌스의 실제 문제에 다양한 방식으로 적용될 수 있습니다. 이 책은 AI 알고리즘에 대한 실용적인 지식과 도시 관행에 대한 이해를 결합하여 AI가 현대 도시에 제공하는 기회와 도전을 강조합니다.
LLM이 도시 설계 및 거버넌스에 적용되는 주요 방식은 다음과 같습니다:
• 사회적 상호작용 및 의사 결정 과정 재편: 대화형 AI는 도시 공간에서 사회적 상호작용, 의사 결정 과정, 미디어를 재편하고 있습니다. AI가 도시에 개입하는 방식에 대한 언어적 프레이밍은 도시의 의사 결정 과정을 포함한 커뮤니케이션 관행에 영향을 미칩니다.
• 도시 계획 및 협의 과정 지원: 도시 계획 이론은 광범위한 주민 및 이해 관계자와의 협의를 통해 도시 개발이 이루어져야 한다고 주장하며, 이는 LLM이 역할을 할 수 있는 대화형 실천의 기본 구성 요소입니다. LLM은 "대화적이고, 참여적이며, 담론적인 형태의 계획"을 지원하는 데 잠재력이 있습니다.
• 이야기 전달 및 내러티브 생성: LLM은 이야기를 만드는 데 능숙하며, 이는 도시 계획 이론가들이 "다양한 도시 내러티브"를 활용하는 "대화적이고, 참여적이며, 담론적인 형태의 계획"으로의 전환을 강조하는 것과 일치합니다. LLM은 계획가의 역할을 강화하는 의미를 확립하는 수단으로 이야기 전달을 활용할 수 있습니다. LLM은 사용자 프롬프트에 따라 이야기를 구성하고 내러티브를 재구성할 수 있습니다.
• 전문 분야에 특화된 튜닝: LLM은 특정 작업이나 행동을 위해 더 전문적인 데이터 세트로 미세 조정될 수 있습니다. 이는 건축, 도시 계획, 공공 보건, 형사 사법, 보존 또는 농업과 같은 분야에 특화된 LLM 개발로 이어질 수 있으며, 특정 도메인 어휘 및 개념을 도입합니다.
• 도시 데이터 분석 및 이해: LLM의 핵심 기능은 도시 생활, 경험 및 과정의 측면과 유사합니다.
◦ 토큰화 (Tokenization): LLM이 텍스트를 작은 단위(토큰)로 분해하는 방식은 도시 지도를 나타내는 방식, 즉 건물의 유형, 도로 배치, 녹지 공간과 같은 반복되는 패턴을 인식하여 토지 이용 유형을 분류하는 방식과 유사합니다. 이는 도시 확장을 분석하고 새로운 개발을 계획하는 데 도움이 될 수 있습니다.
◦ 콘텍스트 창 (Context Windows): LLM이 텍스트 내에서 특정 콘텍스트 창을 통해 토큰을 처리하는 방식은 도시 환경 내의 공간적 근접성과 유사하게 작동합니다. LLM은 도시 내에서 랜드마크 사이의 근접성 패턴을 학습하여 도시를 통한 그럴듯한 경로를 예측하고 생성할 수 있으며, 이는 문장을 구성하는 방식과 유사합니다.
◦ 주의 메커니즘 (Attention Mechanisms): LLM의 주의 메커니즘은 도시 환경의 요소들이 어떻게 주의를 끄는지(예: 랜드마크, 간판, 낙서)를 반영합니다. LLM은 문장의 특정 단어에 강조를 두어 의미에 영향을 미치고 대화의 흐름을 변경할 수 있습니다.
• 이미지 인식 및 생성: LLM은 이미지 인식 기능과 결합하여 공간 추론 능력을 보여줄 수 있습니다. 예를 들어, LLM은 사진 속 물체의 위치를 인식하고 이를 재배열하는 방법에 대한 일련의 동작을 지시하는 대화를 진행할 수 있습니다. LLM은 텍스트 설명을 기반으로 이미지를 생성할 수도 있어 시각 예술가 및 광고 콘텐츠 생성에 활용될 수 있습니다.
• 다중 에이전트 시스템 및 대화 중심 컴퓨팅 (CCC): LLM의 다중 헤드 주의(Multi-head attention) 메커니즘은 도시 환경 내의 협업 프로세스와 유사하며, LLM이 복잡한 작업을 처리하는 데 도움이 되는 다양한 관점을 고려할 수 있도록 합니다. 대화 중심 컴퓨팅(CCC)은 LLM의 기능을 확장하여 다양한 LLM 전문가가 협력하여 복잡한 도시 문제를 해결하고 대화형으로 작업을 관리하고 조정할 수 있도록 합니다.
• 편향 완화 및 윤리적 고려: 미세 조정은 LLM이 포괄적이고, 존중하며, 공정하고, 바람직하지 않은 편향 없이 반응을 생성할 가능성을 높이는 데 사용됩니다. LLM은 사용자에게 제기된 윤리적 질문을 방대한 텍스트, 문학 및 언어적 선례의 영역에 노출시킴으로써 윤리적 담론에 기여할 수 있습니다.
• 직업 재교육: LLM의 발전은 건축 및 계획과 같은 도시 직업의 핵심 역량 및 가치를 재평가해야 할 필요성을 제기하며, AI 활용 능력, 데이터 해석 및 협력적 설계에 대한 새로운 기술 개발이 요구됩니다. LLM은 학습과 프로젝트 작업에 대한 피드백을 제공하여 전문 AI 튜터 역할을 할 수 있습니다.
이러한 LLM의 적용은 도시 환경을 이해하고 관리하며 형성하는 데 있어 상당한 기회와 효율성을 제공합니다. 그러나 이러한 기술이 인간의 전문 지식을 대체할 수 있는 것은 아니며, 인간의 감독과 비판적 사고가 여전히 중요합니다.
질문3 : AI가 도시를 변화시키면서 인간의 의사소통, 경험 및 도시 정체성에 미치는 영향은 무엇인가?
AI가 도시에 미치는 영향은 인간의 의사소통, 경험, 그리고 도시 정체성의 여러 측면을 변화시키고 있습니다.
인간의 의사소통에 미치는 영향
• 사회적 상호작용의 재편: AI, 특히 대규모 언어 모델(LLM)은 도시 공간에서 사회적 상호작용과 의사결정 과정을 재편하고 있습니다. 도시는 디지털 대화의 역동적인 중심지로 부상하며, 대화형 AI는 상호작용, 인식, 위험의 새로운 층위를 도입합니다.
• 언어의 중심성: 이 책은 AI의 언어적, 텍스트 기반 측면에 초점을 맞춥니다. LLM은 도시 대화를 반영하고, 확대하며, 방해합니다. 언어는 AI와 도시를 연결하는 '인대'로 제시됩니다. 도시는 의사소통, 대화, 서사, 텍스트를 통해 협상되고, 묘사되며, 해석되고, 심지어 생성됩니다. 대화형 AI는 도시 내 통신 기술의 최신 발전입니다.
• 챗봇의 진화: ChatGPT와 같은 현대 챗봇은 설득력 있는 대화 능력과 분리된 개념적 스레드를 통합하는 능력을 보여주었습니다. 이들은 지적 담론에서 도시 기호학의 만연함을 입증합니다.
• 수다와 대화: AI는 도시가 "끊임없이 수다 떠는 존재"가 되는 데 기여할 수 있습니다. Samuel McCormick의 저서 "The Chattering Mind"는 일상적인 대화(소문, 한가한 수다)가 심오한 담론을 위한 전제 조건이며, AI 챗봇이 다음 단어를 생성하여 텍스트 흐름을 유지하는 능력을 최적화함으로써 인간의 수다를 모방할 수 있다고 제안합니다.
• 초매개 대화(Hypermediated Conversation): 일상적인 대화는 미디어 엔터테인먼트(영화, 연극, 시트콤)의 스크립트화된 대화를 통해 걸러지고 영향을 받으며, 사람들이 미디어 언어를 모방하여 에코 챔버를 형성하는 "초매개 대화"로 이어집니다. LLM은 텍스트와 스토리를 생성하는 데 능숙하며, 이는 훈련 코퍼스에서 스토리텔링이 만연함을 반영합니다.
• 음성과 텍스트: 인간의 대화는 주로 음성으로 이루어지지만, LLM은 주로 서면 텍스트를 다룹니다. AI 음성 챗은 음성 단어를 텍스트로 번역하여 LLM이 처리하고 다시 음성으로 변환하여 대화 스타일의 음성 상호작용을 생성합니다. 그러나 LLM은 인간이 언어를 습득하는 방식과 동일하게 음성 데이터로 직접 훈련되지 않습니다.
• 소통 실천: AI는 도시의 소통 실천과 의사결정 과정에 개입합니다. LLM은 역할극, 의견 교환, 비판을 통해 윤리적 담론에 기여합니다.
인간의 경험에 미치는 영향
• 인지 및 지각: 언어 자체는 AI의 한 형태로 간주될 수 있으며, 목적 있는 사고, 아이디어 생성, 정보 저장 및 지시 공식화를 촉진하여 도시가 언어가 필수적인 역할을 하는 마음의 확장이라고 제안합니다. 인간의 인지는 환경에 내장되어 있으며, 도시는 마음의 확장으로 볼 수 있습니다.
• 기호학 및 기호: 도시는 소통 매체이자 기호학적 존재입니다. 기호학은 기호에 대한 연구이며, 인간 언어뿐만 아니라 시민 공간, 거리 가구, 장식 및 자연적 기호도 포함합니다. 도시 구조는 권력, 권위를 전달하는 기호 시스템을 구성합니다. AI 모델이 텍스트에서 패턴을 감지하고 재생산하는 능력은 인간의 인식 및 인지와 유사합니다.
• 도시 정체성: Broadbent는 도시 건물이 아이콘으로서 문화적 또는 역사적 정체성을 나타내고, 거리 표지판이 규칙을 나타내는 지표 역할을 하며, 특정 도시 디자인이 문화적/사회적 아이디어를 상징한다고 주장했습니다.
• 가능성의 형성: 언어는 생성적이며 가능성을 형성하고 영향을 미치며, "가능성의 공간"을 틀 짓고 "세계"를 생성합니다. 어떤 행동에 대한 단어가 없다면, 그 행동이 잠재적 행동 레퍼토리에 속할 가능성은 낮습니다.
• 주목(Attention): 도시는 주목에 대한 요구 사항을 제시하며, 우리의 지각적 참여를 형성합니다. 랜드마크, 상징적 구조물 및 신중하게 배치된 표지판은 주목을 끕니다. 언어는 주목을 지시하는 역할을 합니다(브랜드 로고, 광고, 지시). AI 시스템은 "주목" 작업을 배포하며, 이는 LLM에서 언어 이해에 매우 중요합니다.
• 판사이키즘(Panpsychism) 및 지각: 이 책은 도시를 지각 있거나 의식 있는 존재로 보는 아이디어를 탐구하며, 마음/의식이 모든 물질에 편재한다는 판사이키즘과 연결합니다. 도시의 AI는 이러한 "인지적 투자"에 기여합니다. 이러한 관점은 공감적인 도시 관행을 촉진하고 대화에 대한 이해를 확장합니다. Chalmers의 견해는 정보가 어디에나 존재하며, 도시는 정보를 다루는 많은 기술 장치를 포함하므로 잠재적으로 "경험의 섬광"을 가질 수 있다고 제안합니다.
• 도시 행위자: AI, LLM 및 그 구성 요소는 행위자-네트워크 이론(ANT)에서 객체와 사물이 관계망에 참여하는 방식과 유사하게, 행동을 수행하고 상호작용에 영향을 미치는 "행위자"로 간주될 수 있습니다. 이러한 관점은 AI를 단순한 도구로 보는 시각에 도전하며, AI가 상호작용과 결과를 형성하는 능동적인 참여자임을 시사합니다.
도시 정체성에 미치는 영향
• 기호학적 존재: 도시는 기호학적 존재이며, 건축물의 전체적인 구성과 형태는 시민과 미래 세대에게 기호를 전달합니다.
• 서사와 해석: 도시 계획은 점점 더 "다양한 도시 서사"에 의존합니다. 도시 전문가는 "텍스트(계획, 분석, 기사)를 작성하는 저자"로 간주되며, 이 텍스트는 다양하고 종종 상충되는 방식으로 해석될 수 있습니다. AI 스토리텔링은 설득력 있는 서사를 생성하는 데 능숙하며, 이는 텍스트 내 스토리텔링의 보편성을 반영합니다.
• 도시의 재구성: AI는 도시 환경의 필수적인 부분으로 간주되며, 그 씨앗은 언어, 글쓰기, 자동화의 발전을 통해 가장 초기의 도시로 거슬러 올라갑니다. 디지털 도시 인프라는 AI의 존재를 증폭시킵니다. 도시는 인간 인지의 확장으로 간주됩니다.
• 파괴자(Disruptor): AI는 "오랜 도시의 파괴자 중 하나"이며, 도시를 변화시킵니다.
• 핵심 역량의 재평가: 대화형 AI의 부상은 건축 및 계획 전문가의 핵심 역량과 가치를 재평가하게 만들며, AI 리터러시, 데이터 해석 및 협력적 설계의 새로운 기술 개발을 요구합니다. 이는 도시 형성에 있어 인간의 책임과 책임감의 중요성을 강조합니다.
• '인증된 인간': AI가 생성하지 않은 콘텐츠로의 회귀 가능성이 있으며, 여기서는 불완전한 구문이나 독특한 특징을 가진 텍스트나 디자인이 "인증된 인간"으로 자부심의 상징이 될 수 있습니다.
도전과 위험
• 편향(Bias): LLM은 훈련 데이터에서 발생하는 편향(인종, 성별 편향, 고정관념)을 나타낼 수 있습니다. 미세 조정을 통해 이를 완화하려고 시도하지만, 인간의 편향이 여전히 침투할 수 있습니다.
• 일자리 손실: AI는 화이트칼라 직업(텍스트 작성, 검토, 해석)을 위협합니다.
• 불투명성: AI 시스템, 특히 강력한 시스템은 불투명하여 통제, 수정 또는 종료하기 어려울 수 있습니다.
• 감시: 온라인 감시 및 AI가 사용자 상호작용을 모니터링하는 것에 대한 우려가 있습니다.
• 인간 사회성/의미의 상실: 비판론자들은 AI가 사회적 상호작용을 도구화하는 기술적 경향을 증폭시켜 사회성, 돌봄 및 의미 있는 상호작용을 감소시키며, 친절과 같은 현상을 계산할 수 없게 만든다고 주장합니다.
• 실존적 위험(X-risk): 일부 저명한 인물들은 AI가 인간의 지능을 능가하여 인간 멸종으로 이어질 가능성을 경고합니다. 이는 호모 사피엔스가 네안데르탈인을 능가한 것에 비유됩니다.