đặt vấn đề dẫn nhập lý do chọn đề tài, mục tiêu, nội dung nghiên cứu, giới hạn và bố cục đồ án. Chƣơng 2: Cơ Sở Lý Thuyết. Giới thiệu về Machine Learning, Deep Learning, Neural Network, Convolution Neural Network, Tensowflow, VGG. Chƣơng 3: Thiết Kế và Tính Toán Xây dựng sơ đồ khối hệ thống, chức năng của từng khối.
BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 2 do an CHƢƠNG 1. TỔNG QUAN Chƣơng 4: Thi Công Hệ Thống Cách cài đặt Tensorflow trên Python bằng Anaconda, giới thiệu các phần mềm giúp viết chương trình. Chƣơng 5: Kết Quả, Nhận Xét và Đánh Giá Các kết quả đạt được khi thực hiện chương trình, phân tích, nhận xét, đánh giá kết quả thu được. Chƣơng 6: Kết Luận và Hướng Phát Triển Tóm tắt những kết quả đạt được, những hạn chế và nêu lên các hướng phát triển trong tương lai.
BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 3 do an CHƢƠNG 2. CƠ SỞ LÝ THUYẾT Chƣơng 2. Giới thiệu về trí tuệ nhân tạo (AI – Artificial Intelligence) Ngày nay thì trí tuệ nhân tạo thì có mặt ở khắp mọi nơi. Trí tuệ nhân tạo là xu hướng mà các hãng công nghệ lớn đang hướng đến như Google, Facebook, Amazon, Microsoft,.
Các hãng đó đều đầu tư rất lớn vào trí tuệ nhân tạo nhắm tạo ra các sản phẩm phục vụ cho lợi ích của con người. Trí tuệ nhân tạo là trí tuệ được biểu diễn bởi bất cứ một hệ thống nhân tạo nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của trí tuệ nhân tạo. Nó liên quan đến việc cư xử, sự học hỏi, khả năng thích ứng thông minh của máy móc.
[2][3] Bellman (1978) định nghĩa: trí tuệ nhân tạo là tự động hoá các hoạt động phù hợp với suy nghĩ con người, chẳng hạn các hoạt động ra quyết định, giải bài toán, … Rich anh Knight (1991) thì cho rằng: Trí tuệ nhân tạo là khoa học nghiên cứu xem làm thế nào để máy tính có thể thực hiện những công việc mà hiện con người còn làm tốt hơn máy tính. [3][5] Mỗi khái niệm, định nghĩa đều có điểm đúng riêng, nhưng để đơn giản chúng ta có thể hiểu trí tuệ nhân tạo là một ngành khoa học máy tính. Nó xây dựng trên một nền tảng lý thuyết vững chắc và có thể ứng dụng trong việc tự động hóa các hành vi thông minh của máy tính. Giúp máy tính có được những trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu ngôn ngữ, tiếng nói, biết học và tự thích nghi.
BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 4 do an CHƢƠNG 2. CƠ SỞ LÝ THUYẾT Nó là thứ giúp ta sử dụng để trả lời tin nhắn tự động, học cách lái xe, lái máy bay để chúng ta có thể ngồi đó quan sát không cần phải điểu khiển, sắp xếp lại các ảnh của những chuyến đi chơi khác nhau vào những cuốn album riêng biệt, thậm chí AI còn giúp chúng ta quản lí nhà của khi đi vắng hoặc đi mua sắm nữa. Định nghĩa về Machine Learning Machine Learning tương tự như AI và là một tập con của AI. Nếu AI thể hiện mục tiêu của con người thì Machine Learning giúp con người đạt được mục tiêu đó.
Machine learning có khả năng tự học hỏi dựa trên dữ liệu đưa vào mà không cần phải được lập trình cụ thể. Ta có thể định nghĩa Machine Learning như sau: “là một lĩnh vực của trí tuệ nhận tạo liên quan đến việc phát triển các kĩ thuật cho phép các máy tính có thể học. Cụ thể hơn, Machine Learning là một phương pháp để tạo ra các chương trình máy tính bằng việc phân tích các tập dữ liệu đã có sẵn, nhưng khác với thống kê, Machine Learning tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán, tìm ra các mối quan hệ giữ các tập dữ liệu đó, kể cả khi không được chỉ dẫn cụ thể. Nhiều bài toán suy luận được xếp vào loại bài toán khó vì thế nhiệm vụ của Machine Learning là nghiên cứu sự phát triển các giải thuật, suy luận hướng giải quyết tối ưu có thể xử lí được.
Ứng dụng của Machine Learning Machine Learning có nhiều ứng dụng ta có thể phân loại như sau: Ứng dụng trong các bái toán phân loại: chuẩn doán bệnh, bộ lọc spam trong thư điện tử, các bài toán về nhận dạng ảnh… Ứng dụng trong phân cụm: phân vùng ảnh, object detection, tìm quy luật của tự nhiên (thời tiết, biến đổi khí hậu…). Ứng dụng trong các bài toán về xấp xỉ: dự đoán giá nhà, giá vàng, đô la ngoại tệ, dự đoán thời tiết khí hậu… BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 5 do an CHƢƠNG 2. Các bƣớc trong giải quyết bài toán bằng phƣơng pháp Machine Learning Thu thập dữ liệu từ các nguồn liên quan đến bài toán xử lý (đi thu thập các mẫu để training). Chọn các thuộc tính đặc trưng và mã hóa chúng làm cơ sở cho thực hiện Machine Learning.
Tùy vào các bài toán cụ thể mà mức độ phức tạp của các đặc trưng có thể khác nhau. Đối với các bài toán có nhiều đặc tính để chọn, nếu ta chọn hết các đặc tính có thể dẫn đến mất thời gian trong quá trình xử lý cũng như tính toán. Trong những trường hợp này ta có thể hực hiện một số thuật toán về việc lựa chọn thuộc tính như tìm kiếm ngược, tìm kiếm chuyển tiếp… Chọn các mô hình được đào tạo phù hợp để áp dụng. Mỗi mô hình có thể phù hợp với từng lớp bài toán, tuy nhiên một bài toán cũng có thể được giải quyết bằng nhiều mô hình khác nhau.
Các phƣơng pháp Machine Learning a. Học không giám sát (Unsupervised Learning) Chúng ta không biết được đầu ra (outcome) hay các nhãn mà chỉ có dữ liệu đầu vào. Thuật toán Unsupervised Learning sẽ dựa vào cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimension reduction) để thuận tiện trong việc lưu trữ và tính toán. Các bài toán Unsupervised Learning được tiếp tục chia nhỏ thành hai loại: Clustering (phân nhóm) Một bài toán phân nhóm toàn bộ dữ liệu XX thành các nhóm nhỏ dựa trên sự liên quan giữa các dữ liệu trong mỗi nhóm.
Ví dụ: phân nhóm khách hàng dựa trên hành vi mua hàng. Điều này cũng giống như việc ta đưa cho một đứa trẻ rất nhiều mảnh ghép với các hình thù và màu sắc khác nhau, ví dụ tam giác, vuông, tròn với màu xanh và đỏ, sau đó yêu cầu trẻ phân chúng thành từng BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 6 do an CHƢƠNG 2. CƠ SỞ LÝ THUYẾT nhóm. Mặc dù không cho trẻ biết mảnh nào tương ứng với hình nào hoặc màu nào, nhiều khả năng chúng vẫn có thể phân loại các mảnh ghép theo màu hoặc hình dạng.
Association Đây là bài toán khi chúng ta muốn khám phá ra một quy luật dựa trên nhiều dữ liệu cho trước. Ví dụ: những khách hàng nam mua quần áo thường có xu hướng mua thêm đồng hồ hoặc thắt lưng; những khán giả xem phim Spider Man thường có xu hướng xem thêm phim Bat Man, dựa vào đó tạo ra một hệ thống gợi ý khách hàng (Recommendation System), thúc đẩy nhu cầu mua sắm. Như vậy học không giám sát, số lớp cần phân loại không được biết trước, thuật toán sẽ dựa trên các đặc trương cụ thể của từng đối tượng mà phân lớp cho phù hợp với đối tượng đó sau đó tính toán dự đoán dữ liệu ra phù hợp. Học có giám sát (Supervised Learning) Đây là thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước.
Cặp dữ liệu này còn được gọi là (data, label) nghĩa là (dữ liệu, nhãn). Supervised Learning là nhóm phổ biến nhất trong các thuật toán Machine Learning. Sai số giữa đầu ra thực và đầu ra mong muốn sẽ được dùng để điều chỉnh các trọng số của mạng về gần hơn với kết quả mong muốn. Thuật toán Supervised Learning còn được tiếp tục chia nhỏ ra thành hai loại chính: Classification (Phân loại) Một bài toán được gọi là classification nếu các label của input data được chia thành một số hữu hạn nhóm.
Ví dụ: Gmail xác định xem một email có phải là spam hay không; các hãng tín dụng xác định xem một khách hàng có khả năng thanh toán nợ hay không. Ba ví dụ phía trên được chia vào loại này. BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 7 do an CHƢƠNG 2. CƠ SỞ LÝ THUYẾT Regession (Hồi quy) Nếu label không được chia thành các nhóm mà là một giá trị thực cụ thể.
Ví dụ: một căn nhà rộng x m2, có y phòng ngủ và cách trung tâm thành phố z km sẽ có giá là bao nhiêu? Như vậy học có giám sát, số lớp cần phân loại đã được biết trước, dựa vào dữ liệu đầu vào và đầu ra để tính toán dự đoán cho các dữ liệu tiếp sau. GIỚI THIỆU VỀ DEEP LEARNING Deep Learning đã và đang là một chủ đề được đề cập rộng rãi gần đây. Là một phạm trù nhỏ của Machine Learning, Deep Learning tập trung giải quyết các vấn đề liên quan đến mạng thần kinh nhân tạo nhằm nâng cấp các công nghệ như nhận diện giọng nói, tầm nhìn máy tính và xử lý ngôn ngữ tự nhiên, đó là một thuật toán dựa trên một số ý tưởng từ não bộ tới việc tiếp thu nhiều tầng biểu đạt, cả cụ thể lẫn trừu tượng, qua đó làm rõ nghĩa của các loại dữ liệu. Điểm đặc biệt của Deep Learning là tính chính xác dựa vào lượng dữ liệu, lượng dữ liệu có thể có kích thước khổng lồ mà không bị hạn chế.
[2] Deep Learning đang trở thành một trong những lĩnh vực nóng nhất trong khoa học máy tính. Chỉ trong vài năm, Deep Learning đã thúc đẩy tiến bộ trong đa dạng các lĩnh vực như nhận thức sự vật (object perception), dịch tự động (machine translation), nhận diện giọng nói,… những vấn đề từng rất khó khăn với các nhà nghiên cứu trí tuệ nhân tạo. Và để xây dựng được các mô hình của Deep Learning như đã nói ở trên chúng ta cần có một số công cụ hỗ trợ như Caffe, Torch, Tensorflow, Theano. Trong đề tài này nhóm đã quyết định chọn công cụ Tensorflow để nghiên cứu và xây dựng mô hình nhỏ về Deep Learning.
BỘ MÔN ĐIỆN TỬ CÔNG NGHIỆP – Y SINH 8 do an CHƢƠNG 2. GIỚI THIỆU VỀ MẠNG NƠ-RON (NEURAL NETWORKS) 2.