
AI 용어 대백과 (3편)
이번엔 AI 용어
유튜브에서 듣고 커뮤니티에서 봤던 AI 용어들,
이런 느낌이겠지? 정도로 알고 넘어갔던 용어들을 제대로 파악해보자
11. 음성 처리
| 용어 | 의미 | 활용 | 예시 |
| TTS | 텍스트 음성 변환 | TTS 엔진, 음성 합성 | Text-to-Speech |
| STT | 음성 텍스트 변환 | STT 시스템, 음성 인식 | Speech-to-Text |
| ASR | 자동 음성 인식 | ASR 모델, 음성 인식 | Automatic Speech Recognition |
| Speech Recognition | 음성 인식 | 음성 인식 시스템, 음성 명령 | Google Speech API |
| Speech Synthesis | 음성 합성 | 음성 합성 기술, 인공 음성 | AI 목소리 생성 |
| Voice Cloning | 음성 복제 | 보이스 클로닝, 음성 모방 | 특정 사람 목소리 재현 |
| Speaker Recognition | 화자 인식 | 스피커 인식, 화자 구분 | 목소리로 사람 식별 |
| Speech-to-Speech | 음성 음성 변환 | S2S 번역, 실시간 통역 | 음성 → 다른 언어 음성 |
| Voice Assistant | 음성 어시스턴트 | 보이스 어시스턴트, 음성 AI | Siri, Alexa, Google Assistant |
| Wake Word | 깨우는 단어 | 웨이크 워드, 호출어 | "Hey Siri", "OK Google" |
| Audio Classification | 오디오 분류 | 오디오 분류 모델, 소리 인식 | 음악/소음/음성 구분 |
| Noise Reduction | 잡음 제거 | 노이즈 리덕션, 음질 개선 | 배경 소음 제거 |
| Mel-spectrogram | 멜 스펙트로그램 | 멜 스펙트로그램 변환, 음성 특징 | 음성 데이터 시각화 |
| Vocoder | 보코더 | 보코더 모델, 음성 생성 | WaveNet, HiFi-GAN |
12. 이미지/비디오 생성
| 용어 | 의미 | 활용 | 예시 |
| Text-to-Image | 텍스트 이미지 생성 | 텍투이미지, AI 그림 | DALL-E, Midjourney, Stable Diffusion |
| Text-to-Video | 텍스트 비디오 생성 | 텍투비디오, AI 영상 | Sora, Runway, Pika |
| Image-to-Image | 이미지 변환 | 이미지 투 이미지, 스타일 변환 | 사진 → 그림체 변환 |
| Inpainting | 이미지 복원 | 인페인팅, 부분 수정 | 이미지 일부 채우기/수정 |
| Outpainting | 이미지 확장 | 아웃페인팅, 캔버스 확장 | 이미지 경계 밖 생성 |
| Upscaling | 해상도 향상 | 업스케일링, 고화질 변환 | 저해상도 → 고해상도 |
| Style Transfer | 스타일 전이 | 스타일 트랜스퍼, 화풍 변환 | 사진을 그림 스타일로 |
| Face Swap | 얼굴 교체 | 페이스 스왑, 얼굴 바꾸기 | 딥페이크 기술 |
| Deepfake | 딥페이크 | 딥페이크 영상, 합성 영상 | AI로 만든 가짜 영상 |
| Motion Capture | 동작 포착 | 모션 캡처, 움직임 추적 | 3D 애니메이션 제작 |
| 3D Generation | 3D 생성 | 3D 제너레이션, 입체 모델링 | 텍스트 → 3D 모델 |
| Avatar Creation | 아바타 생성 | 아바타 크리에이션, 가상 인물 | AI 캐릭터 생성 |
13. 추천/검색
| 용어 | 의미 | 활용 | 예시 |
| Recommendation System | 추천 시스템 | 추천 알고리즘, 개인화 추천 | Netflix, YouTube 추천 |
| Collaborative Filtering | 협업 필터링 | 협업 필터링, 사용자 기반 추천 | 비슷한 사용자 취향 활용 |
| Content-based Filtering | 콘텐츠 기반 필터링 | 콘텐츠 필터링, 아이템 유사도 | 상품 특성 기반 추천 |
| Semantic Search | 의미 기반 검색 | 시맨틱 서치, 의미 검색 | 의도 파악 검색 |
| Vector Search | 벡터 검색 | 벡터 서치, 임베딩 검색 | 유사도 기반 검색 |
| Information Retrieval | 정보 검색 | 정보 검색 시스템, IR | 문서/데이터 검색 |
| Ranking Algorithm | 순위 알고리즘 | 랭킹 알고리즘, 결과 정렬 | 검색 결과 순서 |
| Click-through Rate | 클릭률 | CTR 최적화, 클릭 비율 | 추천 성능 지표 |
| A/B Testing | A/B 테스트 | A/B 테스팅, 성능 비교 | 알고리즘 효과 측정 |
| Cold Start | 콜드 스타트 | 콜드 스타트 문제, 신규 사용자 | 데이터 부족 상황 |
| Matrix Factorization | 행렬 분해 | 매트릭스 팩토라이제이션, 차원 축소 | 사용자-아이템 행렬 분해 |
| Knowledge Graph | 지식 그래프 | 지식 그래프 구축, 관계 표현 | 개체 간 관계 네트워크 |
14. 벡터/임베딩
| 용어 | 의미 | 활용 | 예시 |
| Vector | 벡터 | 벡터 데이터, 수치 배열 | [0.1, -0.5, 0.8, ...] |
| Embedding | 임베딩 | 워드 임베딩, 벡터 표현 | 단어/문장을 숫자로 변환 |
| Vector Space | 벡터 공간 | 벡터 스페이스, 다차원 공간 | 임베딩이 위치하는 공간 |
| Dimension | 차원 | 벡터 차원, 차원 수 | 512차원, 1024차원 임베딩 |
| Vector Database | 벡터 데이터베이스 | 벡터 DB, 임베딩 저장소 | Pinecone, Weaviate, Chroma |
| FAISS | 유사도 검색 라이브러리 | FAISS 인덱스, 벡터 검색 | Facebook AI Similarity Search |
| Similarity | 유사도 | 벡터 유사도, 유사성 측정 | 두 벡터 간 비슷함 정도 |
| Cosine Similarity | 코사인 유사도 | 코사인 유사도 계산, 각도 기반 | 벡터 간 각도로 유사도 측정 |
| Euclidean Distance | 유클리드 거리 | 유클리드 디스턴스, 직선 거리 | 두 점 사이 최단 거리 |
| Dot Product | 내적 | 벡터 내적, 스칼라곱 | 벡터 곱셈 연산 |
| L2 Norm | L2 놈 | L2 정규화, 벡터 크기 | 벡터 길이 측정 |
| Normalization | 정규화 | 벡터 정규화, 단위 벡터 | 벡터 크기를 1로 조정 |
| Dense Vector | 조밀 벡터 | 덴스 벡터, 실수 벡터 | 모든 값이 채워진 벡터 |
| Sparse Vector | 희소 벡터 | 스파스 벡터, 0이 많은 벡터 | 대부분 값이 0인 벡터 |
| Word2Vec | 단어 벡터화 | 워드투벡, 단어 임베딩 | 단어를 벡터로 변환 |
| Sentence Embedding | 문장 임베딩 | 문장 벡터화, 문장 표현 | 전체 문장을 하나 벡터로 |
15. 하드웨어/인프라
| 용어 | 의미 | 활용 | 예시 |
| GPU | 그래픽 처리 장치 | GPU 클러스터, 병렬 계산 | NVIDIA A100, H100 |
| TPU | 텐서 처리 장치 | TPU 훈련, 구글 전용 칩 | Google Cloud TPU |
| CPU | 중앙 처리 장치 | CPU 추론, 일반 연산 | Intel Xeon, AMD EPYC |
| CUDA | GPU 프로그래밍 플랫폼 | 쿠다 개발, NVIDIA 가속 | 병렬 컴퓨팅 프레임워크 |
| Tensor Cores | 텐서 연산 코어 | 텐서 코어 활용, 혼합 정밀도 | AI 워크로드 최적화 |
| Memory | 메모리 | GPU 메모리, VRAM 부족 | 모델 크기 제한 |
| Bandwidth | 대역폭 | 메모리 밴드위드, 데이터 전송 | 처리 속도 영향 |
| Latency | 지연 시간 | 추론 레이턴시, 응답 속도 | 실시간 처리 중요 |
| Throughput | 처리량 | 스루풋 최적화, 처리 효율 | 단위 시간당 처리량 |
| Batch Size | 배치 크기 | 배치 사이즈 조정, 메모리 효율 | 동시 처리 데이터 수 |
| Distributed Training | 분산 훈련 | 분산 학습, 다중 GPU | 여러 디바이스 병렬 |
| Model Parallelism | 모델 병렬화 | 모델 패럴렐리즘, 큰 모델 분할 | 레이어별 분산 |
| Data Parallelism | 데이터 병렬화 | 데이터 패럴렐리즘, 배치 분산 | 동일 모델 다중 복사 |
| Edge Computing | 엣지 컴퓨팅 | 엣지 디바이스, 로컬 추론 | 모바일, IoT 디바이스 |
| Cloud Computing | 클라우드 컴퓨팅 | 클라우드 훈련, 원격 GPU | AWS, GCP, Azure |
| Serverless | 서버리스 | 서버리스 추론, 함수형 컴퓨팅 | Lambda, Cloud Functions |