Clasificación de capturas de smishing con aprendizaje profundo e IRIS

Pablo Blanco Medina; Andrés Carofilis; Eduardo Fidalgo; Enrique Alegre

doi:10.17979/ja-cea.2024.45.10904

Autores/as

Pablo Blanco Medina Universidad de León
Andrés Carofilis Universidad de Le´on
Eduardo Fidalgo Universidad de Le´on
Enrique Alegre Universidad de Le´on

DOI:

https://doi.org/10.17979/ja-cea.2024.45.10904

Palabras clave:

Seguridad, Aprendizaje Profundo, Apoyo a Operadores Humanos, Redes Sociales, Automatización para la Ayuda Internacional

Resumen

El Smishing es una variante del Phishing que utiliza el Servicio de Mensajes Cortos, los smartphones y la confianza de los usuarios en los servicios de mensajería como herramientas de comunicación para poder llevar a cabo actividades maliciosas. Los usuarios suelen informan de estos mensajes a los Equipos de Respuesta ante Emergencias Informáticas a través de capturas de pantalla de sus teléfonos. Estos equipos pueden beneficiarse de una herramienta que clasifique las capturas de pantalla en distintas categorías, antes de extraer su contenido. Comparamos el rendimiento de Redes Neuronales Convolucionales y Vision Transformers, pre-entrenados en conjuntos de datos como ImageNet, para clasificar estas capturas de smishing en dos categorías: texto dividido en múltiples líneas y texto unido. Publicamos un nuevo conjunto de datos, IRIS-244, que contiene 244 capturas de pantalla de mensajes Smishing con URLs de phishing. Combinando estas arquitecturas con técnicas de augmentación, descubrimos que Xception es la arquitectura con el mejor rendimiento, con una precisión media de $78.36$.

Citas

Akande, O. N., Gbenle, O., Abikoye, O. C., Jimoh, R. G., Akande, H. B., Balogun, A. O., Fatokun, A., 2023. Smsprotect: An automatic smishing detection mobile application. ICT Express 9 (2), 168–176. DOI: https://doi.org/10.1016/j.icte.2022.05.009

Bai, Y., Mei, J., Yuille, A. L., Xie, C., 2021. Are transformers more robust than cnns? Advances in neural information processing systems 34, 26831– 26843.

Blanco-Medina, P., Fidalgo, E., Alegre, E., Vasco-Carofilis, R. A., Janez-Martino, F., Villar, V. F., 2021. Detecting vulnerabilities in critical infras- tructures by classifying exposed industrial control systems using deep lear- ning. Applied Sciences 11 (1), 367. DOI: https://doi.org/10.3390/app11010367

Chollet, F., 2017. Xception: Deep learning with depthwise separable convo- lutions. In: Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 1251–1258. DOI: https://doi.org/10.1109/CVPR.2017.195

Chollet, F., et al., 2015. Keras. https://keras.io.

Coquenet, D., Chatelain, C., Paquet, T., 2023. Dan: a segmentation-free document attention network for handwritten document recognition. IEEE transactions on pattern analysis and machine intelligence. DOI: https://doi.org/10.1109/TPAMI.2023.3235826

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Un- terthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., et al., 2020. An image is worth 16x16 words: Transformers for image recognition at scale. arXiv preprint arXiv:2010.11929.

Fidalgo, E., Alegre, E., Gonzalez-Castro, V., Fernández-Robles, L., 2018. Boosting image classification through semantic attention filtering strategies. Pattern Recognition Letters 112, 176–183. DOI: https://doi.org/10.1016/j.patrec.2018.06.033

Gangwar, A., Gonza ́lez-Castro, V., Alegre, E., Fidalgo, E., 2021. Attm-cnn: Attention and metric learning based cnn for pornography, age and child sexual abuse (csa) detection in images. Neurocomputing 445, 81–104. DOI: https://doi.org/10.1016/j.neucom.2021.02.056

Kumarasiri, W., Siriwardhana, M., Suraweera, S., Senarathne, A., Harsha- nath, S., 2023. Cybersmish: A proactive approach for smishing detection and prevention using machine learning. In: 2023 7th International Conference on I-SMAC (IoT in Social, Mobile, Analytics and Cloud)(I-SMAC). IEEE, pp. 210–217. DOI: https://doi.org/10.1109/I-SMAC58438.2023.10290228

Liu, Z., Mao, H., Wu, C.-Y., Feichtenhofer, C., Darrell, T., Xie, S., 2022. A convnet for the 2020s. In: Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. pp. 11976–11986. DOI: https://doi.org/10.1109/CVPR52688.2022.01167

Maurício, J., Domingues, I., Bernardino, J., 2023. Comparing vision transformers and convolutional neural networks for image classification: A litera- ture review. Applied Sciences 13 (9), 5521. DOI: https://doi.org/10.3390/app13095521

Mishra, S., Soni, D., 2023. Dsmishsms-a system to detect smishing sms. Neural Computing and Applications 35 (7), 4975–4992. DOI: https://doi.org/10.1007/s00521-021-06305-y

Pal, K., Patel, B. V., 2020. Data classification with k-fold cross validation and holdout accuracy estimation methods with 5 different machine lear- ning techniques. In: 2020 fourth international conference on computing methodologies and communication (ICCMC). IEEE, pp. 83–87. DOI: https://doi.org/10.1109/ICCMC48092.2020.ICCMC-00016

Rahman, M. L., Timko, D., Wali, H., Neupane, A., 2023. Users really do respond to smishing. In: Proceedings of the Thirteenth ACM Conference on Data and Application Security and Privacy. pp. 49–60. DOI: https://doi.org/10.1145/3577923.3583640

Recht, B., Roelofs, R., Schmidt, L., Shankar, V., 2019. Do imagenet classifiers generalize to imagenet? In: International conference on machine learning. PMLR, pp. 5389–5400.

Shorten, C., Khoshgoftaar, T. M., 2019. A survey on image data augmentation for deep learning. Journal of big data 6 (1), 1–48. DOI: https://doi.org/10.1186/s40537-019-0197-0

Ulfath, R. E., Sarker, I. H., Chowdhury, M. J. M., Hammoudeh, M., 2022. Detecting smishing attacks using feature extraction and classification techniques. In: Proceedings of the International Conference on Big Data, IoT, and Machine Learning: BIM 2021. Springer, pp. 677–689. DOI: https://doi.org/10.1007/978-981-16-6636-0_51

Clasificación de capturas de smishing con aprendizaje profundo e IRIS

Autores/as

DOI:

Palabras clave:

Resumen

Citas

Descargas

Publicado

Número

Sección

Licencia

Enviar un artículo

Número actual