Home » Tại sao Spotify lại hiểu gu âm nhạc của bạn đến vậy?

Tại sao Spotify lại hiểu gu âm nhạc của bạn đến vậy?

Đăng bởi charlotte.pham
Tại sao Spotify lại hiểu gu âm nhạc của bạn đến vậy?

Mỗi ngày, có hàng triệu người sẵn sàng mở một playlist mới được gợi ý trên Spotify, biết chắc rằng đây sẽ là những bài hát cực kỳ hợp gu âm nhạc của mình. Không nằm ngoài cuộc đua công nghệ nhằm tối ưu hóa trải nghiệm người dùng, Spotify đã tận dụng tối đa Trí tuệ Nhân tạo để trở thành người dẫn đầu trên thị trường streaming nhạc số. Cuối cùng, Spotify đã mang đến cho người dùng những Daily Mix, Release Radar và cả Discover Weekly như thế nào? Hãy cùng rubikAI khám phá trong bài viết dưới đây!

Nhìn lại hai thập kỷ nhạc số

Quay trở lại những năm 2000, cái thời mà âm nhạc thời thượng được nghe bằng CD player hay Ipod, chỉ có bạn mới tự lựa chọn được playlist cho mình. Lúc này thị trường nhạc trực tuyến mới chỉ bắt đầu phát triển, các nền tảng giúp người nghe tìm bài hát mới theo những cách hoàn-toàn-thủ-công. Songza, kênh âm nhạc trực tuyến đầu tiên đã tạo ra các playlist mới bằng một phương pháp không mấy hiệu quả: tìm kiếm những người được coi là chuyên gia âm nhạc và để họ tổng hợp các bài hát mà bản thân họ nghĩ rằng phù hợp để tạo thành playlist.

screen-1.jpg
Songza – nền tảng nhạc số đầu tiên với công cụ gợi ý thủ công đã bị “khai tử” vào năm 2015
Nguồn ảnh: https://apkpure.com/

Nâng cấp hơn một chút, Pandora đã nghĩ đến việc gắn nhãn thủ công cho bản nhạc. Câu hỏi đặt ra là, trên những nhãn này ghi gì? Pandora đã gắn miêu tả thuộc tính cho các bài hát như “vui tươi”, “buồn bã”, hay tính chất âm thanh như “mạnh mẽ”, “nhẹ nhàng” và từ đó lọc ra danh sách kết hợp tương ứng. Thậm chí mãi sau này, phải đến khi Echo Nest ra đời, việc sử dụng thuật toán để phân tích bài hát mới bắt đầu được ứng dụng. Vậy trong 10 năm qua, Spotify đã tận dụng công nghệ mới như thế nào để “phù phép” ra những đề xuất âm nhạc cực kỳ chính xác mà người dùng không thể chối từ?

Trên thực tế, Spotify không tập trung sử dụng 1 mô hình đề xuất duy nhất để tạo ra cuộc cách mạng về trải nghiệm người dùng. Những playlist làm nên thương hiệu của Spotify như Discover Weekly, Your Daily Mix hay Release Radar được tạo nên bởi 3 mô hình đề xuất chính: 

  • Bộ lọc kết hợp: phân tích hành vi của chính bạn và cả những người dùng khác
  • Hệ thống xử lý ngôn ngữ tự nhiên (NLP): sử dụng để phân tích văn bản liên quan
  • Mô hình âm thanh: mô hình tự phân tích các âm thanh thô của bản nhạc

Hãy cùng tìm hiểu kỹ hơn xem 3 mô hình này đang hoạt động hiệu quả thế nào nhé!

Bộ lọc kết hợp

Bộ lọc kết hợp không phải một mô hình đề xuất quá xa lạ. Netflix là một trong những nền tảng đầu tiên sử dụng phương pháp này để gợi ý phim mới cho người dùng. Mô hình trị giá tỷ đô này đã mang lại cho Netflix vị trí dẫn đầu trong địa hạt giải trí. Cũng từ đó, bộ lọc kết hợp trở nên cực kỳ phổ biến và là điểm khởi đầu cho bất kỳ ai muốn phát triển một mô hình đề xuất.

jun-8-netflix.png
Netflix, nền tảng xem phim trực tuyến đã tiên phong trong việc sử dụng bộ lọc kết hợp để thống trị địa hạt giải trí.
Nguồn: studybreaks.com

Tuy nhiên, nếu như Netflix sử dụng hệ thống sao đánh giá để xếp hạng phim và giới thiệu cho người dùng, thì Spotify lại hoàn hoàn không có đánh giá cho âm nhạc. Dữ liệu của Spotify là dữ liệu phản hồi ngầm, được thu thập bằng cách đánh giá hành vi của người dùng. Bất kỳ một hành động dù nhỏ nhất như click vào tên ca sĩ, thêm 1 bài hát vào playlist, phát lại 1 podcast hay bỏ qua 1 bản nhạc đều được nền tảng này ghi lại và đánh giá.

Hãy nhìn kỹ hơn vào ví dụ dưới đây: Một người A thích nghe các bản nhạc 1, 2 ,3 và một người B thích nghe các bản nhạc 2, 3, 4. Như vậy, bộ lọc kết hợp sau ghi thu thập thói quen nghe nhạc của cả 2 sẽ đề xuất bản nhạc 4 cho người A và bản nhạc 1 cho người B. Nhân rộng số này lên hàng trăm triệu người dùng, Spotify có được bộ lọc kết hợp hoàn hảo cho mô hình đề xuất.

Hệ thống xử lý ngôn ngữ tự nhiên (NLP)

Hệ thống xử lý ngôn ngữ tự nhiên là mô hình nổi bật thứ 2 được Spotify sử dụng. NLP phân tích lời nói của con người qua văn bản. AI của Spotify sẽ quét siêu dữ liệu của một bản nhạc và tất cả những tin tức hay blog liên quan khác trên mạng Internet. Spotify liên tục tìm các bài đăng mới để tìm hiểu mọi người đang nói gì về những nghệ sĩ hoặc bài hát nhất định, cũng như ngôn ngữ đang được sử dụng, kể cả các bài hát hoặc nghệ sĩ liên quan. Nếu có, AI sẽ xác định cả các thuật ngữ mô tả, cụm danh từ và các văn bản khác liên quan đến các bài hát hoặc nghệ sĩ đó.

spotify-personalized-editorial-playlists
Chắc chắn người dùng không thể ngờ rằng, một tìm kiếm “vu vơ” trên internet lại là dữ liệu quan trọng để Spotify gợi ý các bài hát có liên quan
Nguồn: diymusician.cdbaby.com

Mỗi nghệ sĩ và bài hát có hàng ngàn thuật ngữ hàng đầu thay đổi hàng ngày, thậm chí là hàng giờ. Các thuật ngữ sẽ được gán trọng số, phản ánh tầm quan trọng tương đối của nó thông qua việc mỗi cá nhân sử dụng thuật ngữ đó bao nhiêu lần để tìm kiếm ca sĩ hoặc bài hát mình yêu thích. Sau đó, giống như trong bộ lọc kết hợp, mô hình NLP sử dụng các thuật ngữ và trọng số này để tạo ra một biểu diễn vectơ của bài hát. Biểu diễn vectơ này được sử dụng để xác định xem hai bản nhạc có giống nhau không, từ đó gợi ý các bản nhạc tương tự cho người dùng. Chắc chắn chúng ta không thể ngờ rằng, ngay cả một tìm kiếm “vu vơ” trên internet cũng là cơ sở dữ liệu quan trọng để Spotify tạo ra một Daily Mix hay Weekly Discover.

Mô hình âm thanh

Dữ liệu từ 2 mô hình đầu tiên dường như đã quá đủ để nền tảng nhạc số này tạo ra một công cụ đề xuất hoàn hảo, vậy tại sao vẫn cần phải phân tích cả âm thanh thô của bản nhạc? Không kể đến việc giúp tăng độ chính xác của công cụ đề xuất, mô hình âm thanh là sự tính toán kỹ lưỡng của Spotify cho một mục đích sâu xa hơn: giúp người dùng tìm những bài hát mới, và đưa nghệ sĩ mới đến với công chúng.

Ví dụ, có một nghệ sĩ hay nhạc sĩ mới đưa lên bài hát của mình lên Spotify. Với vỏn vẹn 50 lượt nghe hoặc thậm chí ít hơn nữa, bộ lọc kết hợp hoàn toàn không giúp gì được vì có quá ít dữ liệu về người dùng liên quan. Hơn thế, là một nghệ sĩ chưa có tiếng tăm trên thị trường âm nhạc, bài viết và thuật ngữ về bài hát hầu như không có và Spotify không thể sử dụng NLP để quét từ khoá và trọng số như các bản nhạc nổi tiếng khác. Đây chính là lúc mô hình âm thanh phát huy khả năng của mình. Mô hình âm thanh thô không phân biệt đối xử giữa những bản nhạc mới phát hành và những nghệ sĩ mới, tất cả những gì nó quan tâm là giai điệu. Và cũng chính nhờ mô hình này mà rất nhiều bài hát mới được thêm vào playlist gợi ý của người dùng hàng ngày. Và để phân tích được dữ liệu âm thanh thô, một công việc nghe rất trừu tượng, Spotify đã sử dụng mạng nơ-ron tích chập, một trong những mô hình Deep Learning cực kỳ tiên tiến. 

Tham khảo: Sophia Ciocca, Medium

0 bình luận
0

Bài viết liên quan

Để lại bình luận