O Uso de Algoritmos de Machine Learning em Ataques de Phishing

Autores

  • Henrique Minillo Moreira Fatec Ourinhos
  • Pedro Henrique Biazi Fatec Ourinhos
  • Richard Aparecido Gabriel Alves Pereira Fatec Ourinhos
  • Isaque Katahira Fatec Ourinhos

Palavras-chave:

Machine Learning, Phishing, Árvore de Decisão, SVM, NB

Resumo

Este artigo propõe uma análise do uso de algoritmos de Machine Learning para detectar ataques de phishing em URLs. Por meio de uma análise comparativa, foi utilizado um dataset disponibilizado pela plataforma Kaggle, contendo 10.000 dados e 48 features. Foram aplicados três algoritmos principais: Árvore de Decisão, Support Vector Machine  (SVM) e Naive Bayes (NB). Os testes mostraram que o SVM, após ajuste de parâmetros pelo módulo GridSearchCV, obteve uma acurácia de 96,48%. Contudo, todos os algoritmos mantiveram níveis de acurácia semelhantes, com SVM e Árvore de Decisão utilizando mais características do que NB para alcançar a mesma eficácia.

Referências

ARIZA, M. et al. Ataques automatizados de engenharia social com o uso de bots em redes sociais profissionais. In: Anais do XXII Simpósio Brasileiro em Segurança da Informação e de Sistemas Computacionais. Porto Alegre, RS, Brasil: SBC, 2022. p. 153–166. ISSN 0000-0000. Disponível em: ⟨https://sol.sbc.org.br/index.php/sbseg/article/view/21665⟩.

BARROS, M.; SILVA, C.; MIRANDA, P. Xphide: Um sistema especialista para a detecção de phishing. In: Anais do XX Simpósio Brasileiro de Segurança da Informação e de Sistemas Computacionais. Porto Alegre, RS, Brasil: SBC, 2020. p. 161–174. ISSN 0000-0000. Disponível em: ⟨https://sol.sbc.org.br/index.php/sbseg/article/view/19235⟩.

CERT.BR. Cartilha de Segurança para Internet. [S.l.]: Comitê Gestor da Internet no Brasil, 2012.

CHEN, S. et al. A novel selective naïve bayes algorithm. Knowledge-Based Systems, v. 192, p. 105361, 2020. ISSN 0950-7051. Disponível em: ⟨https://www.sciencedirect.com/science/article/pii/S0950705119306185⟩.

COUTINHO, V. M. Detecção de páginas de phishing utilizando aprendizado de máquina. 2023.

CRESWELL, J. W. Research Design: Qualitative, Quantitative, and Mixed Methods Approaches. [S.l.]: SAGE Publications, 2014.

KASPERSKY. Brasil é o país com mais ataques de phishing por WhatsApp no mundo em 2022, aponta Kaspersky. 2023. Https://www.kaspersky.com.br/about/press-releases/2023-brasil-e-o-pais-com-mais-ataques-de-phishing-por-whatsapp-no-mundo-em-2022-aponta-kaspersky. Acesso em: 21/04/2024.

PATLE, A.; CHOUHAN, D. S. SVM kernel functions for classification. In: IEEE. 2013 International Conference on Advances in Technology and Engineering (ICATE). [S.l.], 2013. p. 1–9.

RASCHKA, S.; MIRJALILI, V. Python Machine Learning. 2. ed. Birmingham, England: Packt Publishing, 2018.

V FatecSeg - Congresso de Segurança da Informação - 2024 www.fatecseg.com.br

RESNICK, N. E.; BASTOS-FILHO, C. J. A. Aplicação de aprendizado de máquinas para detecção de URLs phishing. Revista de Engenharia e Pesquisa Aplicada, v. 9, n. 1, p. 41–49, dez. 2023. ISSN 2525-4251. Disponível em: ⟨http://dx.doi.org/10.25286/repa.v9i1.2773⟩.

RUSSELL, S.; NORVIG, P. Artificial Intelligence. 3. ed. Upper Saddle River, NJ: Pearson, 2009.

SOUZA, C. et al. Phishkiller: Uma ferramenta para detecção e mitigação de ataques de phishing através de técnicas de deep learning. In: SBC. Anais Estendidos do XIX Simpósio Brasileiro de Segurança da Informação e de Sistemas Computacionais. [S.l.], 2019. p. 81–90.

SOUZA, V. S. S. Introdução à interpretabilidade de redes neurais convolucionais. 2023.

TAN, C. L. Phishing Dataset for Machine Learning: Feature Evaluation. Mendeley, 2018. Disponível em: ⟨https://data.mendeley.com/datasets/h3cgnj8hft/1⟩.

TANG, L.; MAHMOUD, Q. H. A survey of machine learning-based solutions for phishing website detection. Machine Learning and Knowledge Extraction, MDPI AG, v. 3, n. 3, p. 672–694, ago. 2021. ISSN 2504-4990. Disponível em: ⟨http://dx.doi.org/10.3390/make3030034⟩.

VERIZON. Data Breach Investigations Report. 2023. Https://www.verizon.com/business/resources/T86f/reports/2023-data-breach-investigations-report-dbir.pdf. Acesso em: 08/11/2023.

WEBSTER, J.; WATSON, R. T. Analyzing the past to prepare for the future: Writing a literature review. Management Information Systems Quarterly, v. 26, n. 2, p. 3–13, 2002.

YIN, R. K. Case Study Research: Design and Methods. [S.l.]: SAGE Publications, 2014.

Downloads

Publicado

17-11-2024

Como Citar

Minillo Moreira, H., Henrique Biazi, P., Aparecido Gabriel Alves Pereira, R., & Katahira, I. (2024). O Uso de Algoritmos de Machine Learning em Ataques de Phishing. FatecSeg - Congresso De Segurança Da Informação, 1. Recuperado de https://fatecseg.fatecourinhos.edu.br/index.php/fatecseg/article/view/254