티스토리 뷰
반응형
Hugging Face에서 Img To Music 모델을 사용해보자!
이미지의 분위기에 맞게 음악을 생성해주는 AI 모델을 Hugging Face에서 쉽게 체험해볼 수 있어서 나도 한번 사용해보았다.
먼저, Hugging Face는 어떤 사이트인가?
Hugging Face
Hugging Face는 기계 학습을 사용하여 애플리케이션을 구축하기 위한 도구를 개발하는 미국 회사입니다. 자연어 처리 애플리케이션용으로 구축된 Transformers 라이브러리와 사용자가 기계 학습 모델 및 데이터 세트를 공유할 수 있는 플랫폼으로 가장 유명합니다.
Hugging Face 설명을 보다보니 Transformers가 무엇인지 궁금해져 찾아보았다.
Transformers
트랜스포머 모델은 문장 속 단어와 같은 순차 데이터 내의 관계를 추적해 맥락과 의미를 학습하는 신경망입니다. 트랜스포머는 텍스트와 음성을 거의 실시간으로 옮겨 청각 장애인 등 다양한 청중의 회의와 강의 참여를 지원합니다. DNA의 유전자 사슬과 단백질의 아미노산에 대한 이해를 도와 신약 디자인을 가속하기도 하죠. 트랜스포머는 트렌드와 이상 징후를 감지해 부정 방지, 제조 간소화, 온라인 추천, 헬스케어 개선 등에 기여합니다. 우리가 구글이나 마이크로소프트 빙(Microsoft Bing)에서 검색할 때에도 트랜스포머를 사용합니다.
fffiloni - Image to Music
Image에서 Text를 추출하고, Text에서 Music을 추출하는 방식인데, Image에서 Text를 추출할 때 CLIP Interrogator를 사용하며 Text에서 Music을 추출할 때는 Mubert의 모델을 사용한다. Mubert는 AI 음악 생성 서비스를 회사로 Mubert Render, Mubert Studio, Mubert API, Mubert Play의 등의 서비스를 제공하고 있다.
pharma - CLIP Interrogator
Mubert
아래의 영상들은 내가 Text to Image 모델로 생성한 이미지에 Image to Music으로 생성한 음악을 입혀본 영상이다. 우주같은 분위기의 이미지에 맞게 몽환적인 음악이 나온 것 같다. 비슷한 분위기의 세가지 영상인데, 각각이 다른 느낌으로 생성된 것도 재미있게 볼만한 포인트인 것같다.
Reference
반응형
'01. Artificial Intelligence' 카테고리의 다른 글
ChatGPT란? (0) | 2023.06.23 |
---|---|
피부암을 진단하는 Model Dermatology 앱 사용후기 (1) | 2023.01.08 |
GPU가 AI 연구에 왜 중요할까? (0) | 2022.12.04 |
눈으로 보는 통화, SKT의 AI 통화녹음 (0) | 2021.11.24 |
스케치의 색을 자동으로 채워주는 네이버 웹툰 AI 페인터 (0) | 2021.11.10 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 기초 코딩 지식
- 코딩
- 개발 공부
- 기초 개발 지식
- 구글 애널리틱스
- AI의 단점
- 인공지능의 문제점
- 생성형ai의장단점
- 넷플릭스
- ChatGPT
- 독후감
- 혼합현실
- AI의 문제점
- 인공지능의 단점
- 이루다 AI
- 인공지능의장단점
- 챗봇
- ai의장단점
- 통계 관련 책
- 숫자 관련 책
- 음성생성
- 인공지능
- 책 추천
- UX 디자인
- AI
- 개발지식
- 이루다
- 넛지
- 생성형인공지능의장단점
- 불편함
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
글 보관함