Bà CÔNG TH¯¡NG TR¯àNG Đ¾I HàC CÔNG NGHIÞP HÀ NäI Đâ XUÂN S¡N GIÀI PHÁP ĀNG DþNG TRÍ TUÞ NHÂN T¾O NHÂM PHÁT HIÞN GIAO DÞCH BÂT TH¯àNG TRONG HÞ THÞNG QUÀN TRÞ GIAO DÞCH TÀI CHÍNH Đ ÁN TàT NGHIàP TH¾C S) Hà THàNG THÔNG TIN Hà Nái – 2024 Bà CÔNG TH¯¡NG TR¯àNG Đ¾I HàC CÔNG NGHIÞP HÀ NäI Đâ XUÂN S¡N GIÀI PHÁP ĀNG DþNG TRÍ TUÞ NHÂN T¾O NHÂM PHÁT HIÞN GIAO DÞCH BÂT TH¯àNG TRONG HÞ THÞNG QUÀN TRÞ GIAO DÞCH TÀI CHÍNH Ngành há tháng thông tin Mã sá 8480104 Đ ÁN TàT NGHIàP TH¾C S) Hà THàNG THÔNG TIN NG¯äI H¯âNG DÀN: TS.Vũ Viát ThÅng Hà Nái – 2024 i MþC LþC DANH MĀC HÌNH ÀNH. iii DANH MĀC CÁC KÝ HIàU VÀ TĂ VIÀT TÄT. iv DANH MĀC BÀNG. vi Mæ ĐÀU.
vii CH¯¡NG 1: TàNG QUAN V GIAN LÂN TRONG GIAO DàCH TÀI CHÍNH. Giãi thiáu bài toán. Các lo¿i hình gian lÃn trong tài chính. Gian lÃn thông qua mã khuyÁn mãi.
Gian lÃn thông qua chính sách thành viên. GiÁ m¿o danh tính. Đánh cÅp tài khoÁn. Gian lÃn thẻ tín dāng.
Há tháng gian lÃn tài chính. Táng quan há tháng. Há tháng phát hián gian lÃn cÿa Alipay. KÁt luÃn ch°¢ng.
31 CH¯¡NG 2: ĀNG DĀNG THUÂT TOÁN TRÍ TUà NHÂN T¾O PHÁT HIàN GIAN LÂN TÀI CHÍNH. Giãi thiáu các thuÃt toán trí tuá nhân t¿o. Semi-Supervised Learning (Học bán giám sát):. Āng dāng AI phát hián gian lÃn tài chính.
Hián tr¿ng các thuÃt toán AI trong phát hián gian lÃn tài chính. Mô hình Semi-Supervised learning phát hián gian lÃn tài chính. KÁt luÃn ch°¢ng. 51 CH¯¡NG 3: XÂY DĀNG Hà THàNG PHÁT HIàN GIAN LÂN.
TàNG QUAN Hà THàNG. C¢ sç dÿ liáu đß thá. Mô hình AI đß thá học bán giám sát. Bá xử lý trung tâm.
Đánh giá kÁt quÁ thāc nghiám. KÁt luÃn ch°¢ng. i DANH MĀC TÀI LIàU THAM KHÀO. iii iii DANH MþC HÌNH ÀNH Hình 1.
Há tháng phát hián giao dách b¿t th°ång cÿa ngân hàng. Há tháng phát hián giao dách b¿t th°ång cÿa Alipay(TitAnt). KiÁn trúc MaxCompute. KiÁn trúc há tháng cÿa KunPeng.
KiÁn trúc há tháng cÿa Ali-HBase. KiÁn trúc há tháng cÿa MS và sā t°¢ng tác vãi các thành phÁn khác. Chia dataset hu¿n luyán và thử nghiám mô hình dā báo. KiÁn trúc há tháng sử dāng mô hình Semi-Supervised Graph Neural Network.
Đß thá mái quan há m¿ng xã hái. Ví dā minh họa node và c¿nh trong c¢ sç dÿ liáu đß thá. KiÁn trúc dÿ liáu trong Graph DataBase. Giao dián Neo4j.
Táng quan và ho¿t đáng tiêu chu¿n cÿa th° vián GDS. KiÁn trúc mô hình Gated Temporal Attention Network (GTAN) 62 Hình 3. Hu¿n luyán model. Lußng triển khai.
70 iv DANH MþC CÁC KÝ HIÞU VÀ TỪ VI¾T TÀT Vi¿t tÁt Ti¿ng Anh Ti¿ng Vißt eKYC electronic Know Your Customer Công nghá đánh danh khách hàng đián tử MS Model Server Máy chÿ triển khai mô hình học máy IF Isolation Forest ThuÃt toán cô lÃp các điểm dÿ liáu OTS Open Table Service Công cā lÃp kÁ ho¿ch SQL CF Column Family C¢ sç dÿ liáu NoSQL sử dāng hàng và cát TID Transaction Identification Đánh danh giao dách AI Artificial Intelligent Trí tuá nhân t¿o SemiGNN Semi Supervised Graph Neural M¿ng n¢ron đß thá bán giám sát GTAN Gated Temporal Attention M¿ng n¢ron sử dāng c¢ chÁ chú ý Network sử dāng các thông tin thåi gian MLP multi-layer perception Protocol Giao thāc nhÃn thāc nhiÃu lãp TGA Temporal Graph Attention Đß thá sử dāng c¢ chÁ chú ý thåi gian GDS Graph Data Science Khoa học dÿ liáu sử dāng lý thuyÁt đß thá v DANH MþC BÀNG BÁng 3. Mô tÁ dÿ liáu S-FFSD. Tháng kê dÿ liáu S-FFSD. Tháng kê dÿ liáu đß thá S-FFSD.
KÁt quÁ so sánh các mô hình trên nhãn Fraud. KÁt quÁ so sánh các mô hình trên nhãn Fraud. 74 vi LàI CAM ĐOAN Nhÿng nái dung đ°ÿc trình bày trong luÃn văn là nhÿng kiÁn thāc cÿa riêng cá nhân em tích lũy trong quá trình học tÃp, nghiên cāu, không sao chép l¿i cÿa mát công trình nghiên cāu hay luÃn văn cÿa b¿t cā tác giÁ nào. Trong nái dung cÿa luÃn văn, nhÿng phÁn em đã nghiên cāu, trích dÁn đÃu đ°ÿc nêu trong các tài liáu tham khÁo, có ngußn gác, xu¿t xā tên tuái cÿa các tác giÁ và nhà xu¿t bÁn rõ ràng.
Nhÿng điÃu em cam kÁt hoàn toàn là sā thÃt, nÁu sai, em xin cháu mọi hình thāc kỷ luÃt theo quy đánh. Hà Nái, ngày 19 tháng 05 năm 2024 Hác viên thāc hißn Đã Xuân S¢n vii Mâ ĐẦU Nh° chúng ta đã biÁt hián nay vãi sā phát triển bùng ná cÿa công nghá thông tin đã tác đáng lãn đÁn các ho¿t đáng th°ång ngày cÿa xã hái tă viác d¿y học, làm viác, đÁn các nhu cÁu giÁi trí. Do đ¿i dách Covid-19, các bián pháp phòng cháng dách phong toÁ, giÿ khoÁng cách, & đ°ÿc triển khai. Tă nhÿng v¿n đà này gây ra nhiÃu trç ng¿i đái vãi các ho¿t đáng cÁn tiÁp xúc trāc tiÁp nh° l*nh vāc ngân hàng là mát trong sá đó.
Do đó giao dách thanh toán trāc tuyÁn không dùng tiÃn mặt trç nên thuÃn tián và phát triển h¢n bao giå hÁt. T¿i Hoa Kỳ, các ho¿t đáng gian lÃn làm cho sá l°ÿng khách hàng bá thiát h¿i đ¿t māc kỷ lāc 15,4 triáu ng°åi, cao h¢n 16% so vãi năm 2015 và gây thiát h¿i khoÁng 6 tỷ đô. Theo tháng kê cÿa Ngân hàng Nhà n°ãc Viát Nam, sá l°ÿng và giá trá giao dách thanh toán đián tử năm 2019 qua kênh Mobile Banking tăng tr°çng lÁn l°ÿt là 198% và 210%; các kênh Internet Banking và ví đián tă tăng tr°çng tă 37% - 86% so vãi cùng kỳ. Ngày 26/5/2020, Thÿ t°ãng Chính phÿ đã ban hành chß thá sá 22/CT-TTg và viác đ¿y m¿nh triển khai các giÁi pháp phát triển thanh toán không dùng tiÃn mặt t¿i Viát Nam, qua đó thúc đ¿y m¿nh m¿ các ph°¢ng thāc giao dách đián tử, đßng thåi cho th¿y xu h°ãng t¿t yÁu cÿa viác chuyển dách hình thāc thanh toán.
Trong bái cÁnh đó, ngân hàng và các công ty công nghá tài chính (Fintech) đã và đang tÃp trung phát triển các āng dāng mãi trên nÃn tÁng công nghá sá, cung c¿p nhÿng sÁn ph¿m, dách vā đi kèm vãi nhÿng hình thāc khuyÁn mãi vô cùng h¿p dÁn h°ãng tãi viác đáp āng káp thåi nhu cÁu thay đái cÿa khách hàng. Bên c¿nh nhÿng lÿi ích to lãn mà giao dách tài chính trāc tuyÁn mang đÁn, ng°åi sử dāng đã và đang phÁi đái mặt vãi nhÿng rÿi ro tiÃm ¿n tă viác th¿t thoát dÿ liáu cá nhân. NÁu không có nhÃn thāc đÁy đÿ, ng°åi sử dāng s¿ viii dß dàng trç thành māc tiêu cÿa tái ph¿m tài chính, có nguy c¢ bá lÿi dāng cho nhÿng giao dách b¿t chính và thiát h¿i tài sÁn không mong muán. Các ngân hàng tr°ãc đây sử dāng cách bÁo mÃt truyÃn tháng dāa vào yÁu tá con ng°åi nh° cán bá, nhân viên ngân hàng và khách hàng sử dāng dách vā.
Trong đó các cán bá nhân viên đ°ÿc giao nhiám vā th°ång xuyên giám sát các quy trình kỹ thuÃt trong ho¿t đáng thanh toán& để phát hián gian lÃn, khách hàng th°ång đ°ÿc khuyÁn cáo bằng viác tā bÁo vá tài khoÁn cÿa mình. Dß dàng nhÃn th¿y cách truyÃn tháng có đá bÁo mÃt an toàn không cao bçi các ho¿t đáng gian lÃn hián nay ngày càng dißn ra hÁt sāc tinh vi và phāc t¿p h¢n. Do đó, v¿n đà đặt ra cÁn có các giÁi pháp thông minh h¢n, hiáu quÁ h¢n để tăng c°ång tính bÁo mÃt trong giao dách tài chính thông qua viác có thể tā đáng phát hián ra các giao dách b¿t th°ång (hoặc các giao dách có nguy c¢ chāa đāng gian lÃn) mát cách nhanh chóng và hiáu quÁ. Trong bài báo [1] tác giÁ và nhóm cáng sā cũng nêu rõ các thiát h¿i to lãn trong các giao dách tài chính có tính bÁo mÃt kém.
Đặc biát trong thåi kỳ đ¿i dách covid đã làm đ¿y nhanh các giao dách tài chính trāc tuyÁn. Trong nghiên cāu cũng giãi thiáu táng quan và các ph°¢ng pháp thông minh nhằm phát hián các giao dách tài chính b¿t th°ång mát cách hiáu quÁ. Cũng trong bài báo này tác giÁ có tháng kê các giÁi pháp dāa trên máy học nh°: SVM, CNN, Naïve Bayes, LSTM, v. Cuái cùng các tác giÁ cũng nêu rõ các thách thāc trong viác phát hián ra các giao dách tài chính bçi các đái t°ÿng phá ho¿i luôn có xu h°ãng thay đái công nghá để tránh khßi bá há tháng phát hián.
Trong bài báo [2] tác giÁ Shaosheng Cao và các cáng sā đã giãi thiáu há tháng TitAnt có khÁ năng phát hián ra các gian lÃn trong giao dách tài chính online trong thåi gian thāc. Trong nghiên cāu cũng trình bày các v¿n đÃ, các ph°¢ng pháp trích chọn đặc tr°ng và phát hián giao dách có gian lÃn bao gßm: ix thuÃt toán dāa trên tÃp luÃt, thuÃt toán hßi quy logic, thuÃt toán Gradient Boosting Decision Tree (GBDT), v. Để đÁm bÁo há tháng có thể ho¿t đáng trong thåi gian thāc nhóm tác giÁ đã triển khai mô hình dāa trên các công cā hß trÿ mã ngußn mç nh°: MaxCompute, KunPeng, MS và Ali-Hbase. Các công cā này có nhiám vā hß trÿ l°u trÿ phân tán, hu¿n luyán và dā đoán các giao dách online.
Mặc dù cũng đã có nhiÃu nghiên cāu khác nhau và bài toán này tuy nhiên ch°a có mát giÁi pháp nào là tuyát đái. Theo thåi gian các đái t°ÿng thāc hián hành vi gian lÃn cũng s¿ thay đái cách thāc thāc hián nhằm tránh sā phát hián cÿa há tháng và điÃu này luôn là mát thách thāc vãi nhÿng ng°åi có trách nhiám bÁo mÃt trong các há tháng ngân hàng hay các công ty tài chính. Chính vì các lý do trên đây em đã chọn đà tài <Giải pháp ứng dụng trí tuệ nhân tạo nhằm phát hiện giao dịch bất thường trong hệ thống quản trị giao dịch tài chính=. 1 CH¯¡NG 1: TàNG QUAN VÀ GIAN L¾N TRONG GIAO DÞCH TÀI CHÍNH 1.
Gißi thißu bài toán Ngày nay các dách vā tài chính đặc biát là dách vā tài chính trāc tuyÁn mang l¿i nhiÃu lÿi ích kinh tÁ to lãn cho xã hái. Tuy nhiên cùng vãi đó các hành vi gian lÃn xu¿t hián ngày càng nhiÃu. Gian lÃn tài chính là hành vi cá ý lăa dái liên quan đÁn các giao dách tài chính nhằm māc đích thu lÿi cá nhân.