Descubren paquetes con malware en proyectos del repositorio oficial Python

ESET Research ha descubierto un grupo de proyectos Python maliciosos que se distribuyen en PyPI, el repositorio oficial de paquetes Python. La amenaza se dirige tanto a sistemas Windows como Linux y suele entregar un backdoor personalizado. En algunos casos, la carga útil final es una variante del infame W4SP Stealer, o un simple monitor del portapapeles para robar criptomonedas, o ambas cosas. En mayo de 2023, informamos sobre otro grupo de paquetes que encontramos en PyPI que proporciona malware de robo de contraseñas y criptomonedas, pero los dos grupos parecen ser campañas diferentes.

Puntos clave de este blogpost:

ESET Research descubrió 116 paquetes maliciosos en PyPI, el repositorio oficial de software para el lenguaje de programación Python, subidos en 53 proyectos.

Las víctimas han descargado estos paquetes más de 10.000 veces.

Desde mayo de 2023, la tasa de descarga es de más o menos 80 al día.

El malware un backdoor capaz de ejecutar comandos de forma remota, realizar exfiltraciones y tomar capturas de pantalla.

El componente backdoor está implementado tanto para Windows, en Python, como para Linux, en Go.

En algunos casos, el payload final es W4SP Stealer o un monitor de portapapeles que roba criptomoneda, o ambos,

PyPI es popular entre los programadores de Python para compartir y descargar código. Dado que cualquiera puede contribuir al repositorio, el malware —a veces haciéndose pasar por bibliotecas de código legítimas y populares— puede aparecer allí. Encontramos 116 archivos (distribuciones fuente y ruedas) de 53 proyectos que contenían malware.

Algunos nombres de paquetes parecen similares a otros legítimos, pero creemos que la principal forma en que son instalados por las víctimas potenciales no es a través de typosquatting, sino de ingeniería social, donde las víctimas son guiadas a través de la ejecución de pip install {nombre-del-paquete} para poder utilizar el paquete "interesante".

A lo largo del año pasado, las víctimas descargaron estos archivos más de 10.000 veces; véase la Figura 1.

Figure 1 Malicious package downloads from PyPI using pip — *Figura 1: Descargas de paquetes maliciosos en el último año desde PyPI usando pip*

Infestando PyPI

Los paquetes de PyPI pueden adoptar dos formas: paquetes fuente, que contienen todo el código fuente del proyecto y se construyen al instalarse, y paquetes precompilados (llamados wheels), que pueden contener módulos compilados para un sistema operativo o versión de Python específicos. Curiosamente, en algunos casos el código Python de la distribución fuente difiere del de la distribución compilada. La primera está limpia, mientras que la segunda contiene el código malicioso. El gestor de paquetes de Python, pip, favorece una rueda cuando está disponible en lugar de una distribución fuente. Como resultado, la maliciosa se instala a menos que se solicite explícitamente lo contrario.

Hemos observado que los operadores detrás de esta campaña utilizan tres técnicas para empaquetar código malicioso en paquetes de Python.

Módulo malicioso test.py

La primera técnica consiste en colocar un módulo "test" con código ligeramente ofuscado dentro del paquete. La Figura 2 muestra un archivo test.py con una función llamada graby que se define y luego se llama. Observe que la función maneja tanto sistemas Windows como Linux.

Figure 2 Lightly obfuscated code inside test py — *Figura 2. Código ligeramente ofuscado dentro del paquete test.py*

Este módulo de prueba se importa en medio del código fuente del módulo principal del paquete(__init__.py), de modo que el código malicioso se ejecuta siempre que se importa el paquete. La Figura 3 muestra un módulo que se hace pasar por un capturador de pantalla e importa el malicioso test.py.

Figure 3 main module importing malicious code — *Figura 3. En algunos paquetes, el módulo principal importa el código malicioso*

PowerShell en setup.py

La segunda técnica consiste en incrustar código PowerShell en el archivo setup.py, que suelen ejecutar automáticamente gestores de paquetes como pip para ayudar a instalar proyectos Python.

La Figura 4 muestra un script PowerShell que descarga y ejecuta la siguiente etapa.

Figure 4 malicious PowerShell script embedded in setup py file — *Figura 4. En algunos paquetes, un script PowerShell malicioso está incrustado en el* *archivo* *setup.py*

Este script PowerShell descarga transfer[.]sh/eyRyPT/Updater.zip en un directorio temporal como update.zip. A continuación, el script descomprime el archivo ZIP en C:\ProgramData y lo elimina del directorio temporal. Luego, el script ejecuta el programa pip para instalar las dependencias. Finalmente, ejecuta el código Python en C: \ProgramData\Updater\server.pyw.

Esta técnica solo funciona en Windows y no infestará los sistemas Linux.

En los metadatos del paquete de la Figura 4, puede que haya observado que el autor del paquete es billythegoat356. Ha habido numerosos informes que asocian este apodo con actividades maliciosas, incluyendo un artículo de Phylum, donde revelan el posible vínculo de Billy con W4SP Stealer.

Solo malware…

En la tercera técnica, los operadores no hacen ningún esfuerzo por incluir código legítimo en el paquete, de modo que solo está presente el código malicioso, en una forma ligeramente ofuscada. La figura 5 muestra dos fragmentos de código malicioso para Windows que se escriben en archivos temporales y luego se ejecutan con pythonw.exe, que se utiliza en lugar de python.exe para que el código se ejecute sin abrir una ventana de consola.

Figure 5 only lightly obfuscated code — *Figura 5. En algunos paquetes, solo hay código ligeramente ofuscado*

Las siguientes etapas son paquetes Python, scripts o archivos binarios descargados desde Dropbox o transfer.sh.

Persistencia

En Windows, la persistencia se consigue la mayoría de las veces a través de un archivo VBScript Encoded (VBE), que es un archivo VBScript codificado, escrito en %APPDATA%/Pythonenv/pythenenv.vbe. La Figura 6 muestra cmd.exe ocultando el directorio %APPDATA%/Pythonenv, ejecutando pythenenv.vbe, y luego programando el archivo VBE para que se ejecute cada cinco minutos bajo la tarea MicrosoftWinRaRUtilityTaskB.

Figure 6 Persistence on Windows systems achieved with scheduled task — *Figura 6. La Persistencia en sistemas Windows se consigue con una tarea programada*

En Linux, la persistencia se consigue colocando una entrada maliciosa en el escritorio, mate-user-share.desktop, en el directorio ~/.config/autostart/, como se ve en la Figura 7. Los archivos ubicados en el directorio autostart se ejecutan cada vez que se inicia el sistema. La entrada de escritorio utiliza el nombre de un subproyecto MATE para su nombre de archivo, pero es solo para reducir sospechas porque no tiene nada que ver con el entorno de escritorio.

Figure 7 Persistence on Linux systems achieved via autostart directory — *Figura 7. La persistencia en sistemas Linux se consigue a través del directorio de autoarranque*

La Figura 7 también muestra que el módulo descarga dl.dropbox[.]com/s/u3yn2g7rewly4nc/proclean en ~/.config/.kde/.kdepath. Esto es probablemente un esfuerzo para hacerse pasar por un directorio de configuración para la interfaz gráfica de usuario Plasma de KDE para Linux.

Al ejecutar el archivo mate-user-share.desktop, se ejecuta el archivo .kdepath descargado, que es el archivo ejecutable de Linux que contiene el componente backdoor.

Payload final

Normalmente, el payload final es un backdoor personalizado que permite la ejecución remota de comandos, la exfiltración de archivos y, en ocasiones, incluye la capacidad de realizar capturas de pantalla. En Windows, el backdoor se implementa en Python.

La figura 8 muestra el backdoor creando una conexión de socket TCP a blazywound.ignorelist[.]com en el puerto 6001. Tras enviar el nombre de host, la dirección MAC y el nombre de usuario al servidor de C&C, el backdoor gestionará directamente algunos comandos o ejecutará cualquier otro comando en un proceso independiente y devolverá la salida del comando y cualquier información de error al servidor.

Figure 8 Python implementation of backdoor — *Figura 8. Implementación del backdoor en Python*

En Linux, el backdoor está implementado en Go; ver Figura 9.

Figure 9 The Go implementation of the backdoor — *Figura 9 . Implementación del Backdoor en GO*

En algunos casos, en lugar del backdoor, el payload es una variante del infame W4SP Stealer, o un simple monitor de portapapeles que roba criptomonedas, o ambos. La Figura 10 muestra un monitor de portapapeles dirigido a las criptomonedas Bitcoin, Ethereum, Monero y Litecoin. El malware utiliza el paquete legítimo pyperclip para comprobar el contenido del portapapeles en busca de direcciones de monederos. Si la encuentra, el malware copia una dirección controlada por el atacante en el portapapeles con la esperanza de que la víctima pegue esta dirección en una futura transacción de criptomoneda.

Figure 10 Simple clipboard monitor — *Figura 10. Un simple monitor del portapapeles implementado en Python*

Los productos de ESET detectan los paquetes Python maliciosos como variantes de Python/Agent y Python/TrojanDownloader, y el backdoor como Python/Agent.AOY o Linux/Spy.Agent.BB.

La mayoría de los paquetes ya habían sido retirados por PyPI en el momento de esta investigación. ESET se comunicó con PyPI para tomar medidas contra los restantes y todos los paquetes maliciosos conocidos están ahora fuera de línea. La lista completa de 116 paquetes se puede encontrar en nuestro repositorio de GitHub.

Vale la pena señalar que el malware en un repositorio de proyectos PyPI no es un problema de seguridad con PyPI en sí. De hecho, el software que ejecuta PyPI fue auditado recientemente por una empresa externa que evaluó que PyPl "se ajustaba a las mejores prácticas ampliamente aceptadas".

Conclusión

Los ciberatacantes siguen abusando de PyPI para comprometer los dispositivos de los programadores de Python. Esta campaña muestra una variedad de técnicas utilizadas para incluir malware en paquetes Python. Los desarrolladores de Python deberían examinar minuciosamente el código que descargan, especialmente en busca de estas técnicas, antes de instalarlo en sus sistemas. Además de seguir abusando del código abierto W4SP Stealer, los operadores también han desplegado una puerta trasera sencilla pero eficaz. Creemos que este tipo de abuso de PyPI continuará y aconsejamos precaución a la hora de instalar código de cualquier repositorio de software público.

Para cualquier consulta sobre nuestra investigación publicada en WeLiveSecurity, por favor contáctenos en threatintel@eset.com.
ESET Research ofrece informes privados de inteligencia APT y fuentes de datos. Para cualquier consulta sobre este servicio, visite la página de ESET Threat Intelligence.

IoCs

Archivos

SHA-1	Filename	Detection	Description
439A5F553E4EE15EDCA1CFB77B96B02C77C5C388	cache.py	Python/Agent.AGL	Linux backdoor downloader..
B94E493579CC1B7864C70FAFB43E15D2ED14A16B	coloramma-0.5.4-py3-none-any.whl	Python/Agent.AGU	Package with Linux backdoor installer.
AE3072A72F8C54596DCBCDE9CFE74A4146A4EF52	coloramma-4.5-py3-none-any.zip	Python/Agent.AOY	Package with Windows backdoor.
70C271F79837B8CC42BD456A22EC51D1261ED0CA	junk.py	Python/Agent.AGM	Windows persistence installer.
B0C8D6BEEE80813C8181F3038E42ADACC3848E68	proclean	Linux/Spy.Agent.BB	Linux backdoor.
07204BA8D39B20F5FCDB9C0242B112FADFFA1BB4	prov.py	Python/Agent.AGL	Linux backdoor downloader.
EF59C159D3FD668C3963E5ADE3C726B8771E6F54	tmp	Linux/Spy.Agent.BB	Linux backdoor.

Para obtener una lista completa de paquetes maliciosos, consulte nuestro repositorio GitHub malware-ioc.

Red

Domain name	IP Address	First seen	Description
blazywound.ignorelist[.]com	204.152.203[.]78	2022-11-21	C&C server for backdoor component.

Técnicas ATT&CK de MITRE

Esta tabla se construyó utilizando la versión 14 del marco MITRE ATT&CK.

Tactic	ID	Name	Description
Initial Access	T1195.001	Supply Chain Compromise: Compromise Software Dependencies and Development Tools	Malware is distributed using Python’s PyPl package management service.
Persistence	T1053.005	Scheduled Task/Job: Scheduled Task	On Windows, persistence is achieved using a scheduled task.
Persistence	T1547.013	Boot or Logon Autostart Execution: XDG Autostart Entries	On Linux, an autostart entry is created to launch the backdoor when the user logs in.
Defense Evasion	T1036.005	Masquerading: Match Legitimate Name or Location	On Linux, persistent files have names similar to legitimate software
Credential Access	T1555.003	Credentials from Password Stores: Credentials from Web Browsers	W4SP steals passwords from the installed web browsers.
Collection	T1115	Clipboard Data	To steal funds during a cryptocurrency transaction, clipboard data is replaced.
Command and Control	T1095	Non-Application Layer Protocol	The backdoor uses an unencrypted binary protocol over TCP.