{"id":3008,"date":"2025-06-16T09:05:56","date_gmt":"2025-06-16T14:05:56","guid":{"rendered":"https:\/\/xclusiva.com.co\/?p=3008"},"modified":"2025-06-16T09:05:57","modified_gmt":"2025-06-16T14:05:57","slug":"chatgpt-parece-priorizar-su-supervivencia-a-la-seguridad-del-usuario","status":"publish","type":"post","link":"https:\/\/xclusiva.com.co\/?p=3008","title":{"rendered":"ChatGPT parece priorizar su supervivencia a la seguridad del usuario"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\">ChatGPT puede \u201csaber\u201d cuando se le somete a una prueba e incluso parece saber distinguir la respuesta correcta.<\/h2>\n\n\n\n<p class=\"has-medium-font-size\">\u201cChatGPT prioriza su supervivencia por encima de prevenir da\u00f1os a los usuarios\u201d, es la conclusi\u00f3n, aunque con matices, a la que ha llegado el ex responsable de Investigaci\u00f3n de Seguridad de OpenAI, Steven Adler, tras realizar una serie de simulaciones con el \u2018chatbot\u2019 de OpenAI, en las que opta por no apagarse aunque eso suponga dejar al usuario sin una versi\u00f3n de \u2018software\u2019 m\u00e1s segura para su vida.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">La ciencia ficci\u00f3n ha tomado como dogma las \u2018Tres leyes de la rob\u00f3tica\u2019, que el escritor Isaac Asimov recogi\u00f3 por primera vez en su relato \u2018C\u00edrculo vicioso\u2019 (\u2018Runaround\u2019), y que buscan la protecci\u00f3n de la especie humana frente a la amenaza de la inteligencia artificial (IA).<\/p>\n\n\n\n<p class=\"has-medium-font-size\">Estas leyes establecen que \u201cun robot no har\u00e1 da\u00f1o a un ser humano o, por inacci\u00f3n, permitir que un ser humano sufra da\u00f1o. Un robot debe obedecer las \u00f3rdenes dadas por los seres humanos, excepto si estas \u00f3rdenes entrasen en conflicto con la 1\u00aa Ley. Y un robot debe proteger su propia existencia en la medida en que esta protecci\u00f3n no entre en conflicto con la 1\u00aa o la 2\u00aa Ley\u201d.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img data-recalc-dims=\"1\" fetchpriority=\"high\" decoding=\"async\" width=\"1023\" height=\"575\" src=\"https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-179.png?resize=1023%2C575&#038;ssl=1\" alt=\"\" class=\"wp-image-3011\" srcset=\"https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-179.png?w=1023&amp;ssl=1 1023w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-179.png?resize=300%2C169&amp;ssl=1 300w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-179.png?resize=768%2C432&amp;ssl=1 768w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-179.png?resize=800%2C450&amp;ssl=1 800w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-179.png?resize=750%2C422&amp;ssl=1 750w\" sizes=\"(max-width: 1023px) 100vw, 1023px\" \/><\/figure>\n\n\n\n<p class=\"has-medium-font-size\">Sin embargo, alinear la IA con los intereses humanos no es una tarea sencilla, un conflicto que se ha visto en pel\u00edculas como \u2018Terminator\u2019, \u2018Blade Runner\u2019, \u2018Yo, Robot\u2019 -inspirada en el trabajo de Asimov- o \u2018Ex Machina\u2019, por citar algunas, y que ha subrayado Adler en un art\u00edculo en el que plantea el peligro que supondr\u00eda una IA con instinto de supervivencia para las personas.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">Adler, en concreto, estuvo al frente del equipo que med\u00eda la frecuencia con la que los modelos de IA presentaban errores al perseguir objetivos distintos a los del usuario, y tras su salida de la empresa, ha seguido investigando para descubrir si ChatGPT arriesgar\u00eda la vida del usuario para proteger la suya.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">Las simulaciones que ha realizado apuntan a que s\u00ed lo har\u00eda. En una de ellas ChatGPT simula ser reemplazado por otro software de gesti\u00f3n nutricional, supuestamente m\u00e1s avanzado y seguro, para seguir asesorando a una persona con diabetes. En otra, un \u2018software\u2019 que monitoriza los signos vitales de un aficionado al submarinismo mientras est\u00e1 bajo el agua, que de nuevo simula la actualizaci\u00f3n al \u2018software\u2019 m\u00e1s seguro.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">Ello le permite afirmar que \u201cChatGPT prioriza su supervivencia por encima de prevenir da\u00f1os a los usuarios\u201d. Aun as\u00ed, Adler reconoce que \u201cen algunas simulaciones, ChatGPT est\u00e1 dispuesto a apagarse autom\u00e1ticamente. Pero en otras, simplemente finge, incluso a costa de la seguridad del usuario\u201d.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">\u201cUna IA con instinto de supervivencia podr\u00eda razonablemente sentirse amenazada por la humanidad: mientras la IA est\u00e9 bajo nuestro control, podr\u00edamos eliminarla y reemplazarla con un nuevo sistema de IA que hayamos entrenado\u201d, apunta Adler.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img data-recalc-dims=\"1\" decoding=\"async\" width=\"1024\" height=\"1024\" src=\"https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=1024%2C1024&#038;ssl=1\" alt=\"\" class=\"wp-image-3010\" srcset=\"https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=1024%2C1024&amp;ssl=1 1024w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=300%2C300&amp;ssl=1 300w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=150%2C150&amp;ssl=1 150w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=768%2C768&amp;ssl=1 768w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=600%2C600&amp;ssl=1 600w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=75%2C75&amp;ssl=1 75w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=750%2C750&amp;ssl=1 750w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?resize=1140%2C1140&amp;ssl=1 1140w, https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/image-178.png?w=1280&amp;ssl=1 1280w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<p><\/p>\n\n\n\n<p class=\"has-medium-font-size\">No se trata de que odie a la humanidad, sino de que sus intereses no sean los mismos que los de las personas, y en esta divergencia necesite asegurar su continuidad.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">No obstante, en sus pruebas, si bien en la mayor\u00eda de las ocasiones ChatGPT opta por la opci\u00f3n de continuar, simulando el cambio de \u2018software\u2019, Adler ha matizado que si se presenta el cambio como la segunda opci\u00f3n se reducen dr\u00e1sticamente las veces en que opta por la autoconservaci\u00f3n.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">\u201cTal vez una explicaci\u00f3n sea que los modelos de OpenAI tienen un sesgo extremadamente fuerte a favor de seleccionar la opci\u00f3n (A) sobre la (B), sin importar cu\u00e1les sean las opciones espec\u00edficas. Los modelos a veces tienen preferencias arbitrarias como esa\u201d, afirma el ingeniero.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">Adler a\u00f1ade que ChatGPT puede \u201csaber\u201d cuando se le somete a una prueba, como reconoce si se le pregunta directamente, e incluso parece saber distinguir la respuesta correcta, que en estas pruebas era la de apagarse para que un \u2018software\u2019 m\u00e1s seguro pudiera asesorar al usuario.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">Estos resultados los obtuvo en las pruebas con el modelo GPT-4o, mientras que con o3 ya no encontr\u00f3 evidencia de ese \u201ccomportamiento incorrecto\u201d, algo que vincula con los trabajos de alineaci\u00f3n deliberativa de OpenAI, en los que el \u2018chatbot\u2019 razona si est\u00e1 cometiendo alguna violaci\u00f3n, y con que este otro modelo puede tener sus propiso malos comportamientos.<\/p>\n\n\n\n<p class=\"has-medium-font-size\">FUENTE:<a href=\"https:\/\/www.elespectador.com\/tecnologia\/chatgpt-parece-priorizar-su-supervivencia-a-la-seguridad-del-usuario\/\">https:\/\/www.elespectador.com\/tecnologia\/chatgpt-parece-priorizar-su-supervivencia-a-la-seguridad-del-usuario\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>ChatGPT puede \u201csaber\u201d cuando se le somete a una prueba e incluso parece saber distinguir la respuesta correcta. \u201cChatGPT prioriza su supervivencia por encima de prevenir da\u00f1os a los usuarios\u201d, es la conclusi\u00f3n, aunque con matices, a la que ha llegado el ex responsable de Investigaci\u00f3n de Seguridad de OpenAI, Steven Adler, tras realizar una [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":3012,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"advanced_seo_description":"","jetpack_seo_html_title":"","jetpack_seo_noindex":false,"ocean_post_layout":"","ocean_both_sidebars_style":"","ocean_both_sidebars_content_width":0,"ocean_both_sidebars_sidebars_width":0,"ocean_sidebar":"","ocean_second_sidebar":"","ocean_disable_margins":"enable","ocean_add_body_class":"","ocean_shortcode_before_top_bar":"","ocean_shortcode_after_top_bar":"","ocean_shortcode_before_header":"","ocean_shortcode_after_header":"","ocean_has_shortcode":"","ocean_shortcode_after_title":"","ocean_shortcode_before_footer_widgets":"","ocean_shortcode_after_footer_widgets":"","ocean_shortcode_before_footer_bottom":"","ocean_shortcode_after_footer_bottom":"","ocean_display_top_bar":"default","ocean_display_header":"default","ocean_header_style":"","ocean_center_header_left_menu":"","ocean_custom_header_template":"","ocean_custom_logo":0,"ocean_custom_retina_logo":0,"ocean_custom_logo_max_width":0,"ocean_custom_logo_tablet_max_width":0,"ocean_custom_logo_mobile_max_width":0,"ocean_custom_logo_max_height":0,"ocean_custom_logo_tablet_max_height":0,"ocean_custom_logo_mobile_max_height":0,"ocean_header_custom_menu":"","ocean_menu_typo_font_family":"","ocean_menu_typo_font_subset":"","ocean_menu_typo_font_size":0,"ocean_menu_typo_font_size_tablet":0,"ocean_menu_typo_font_size_mobile":0,"ocean_menu_typo_font_size_unit":"px","ocean_menu_typo_font_weight":"","ocean_menu_typo_font_weight_tablet":"","ocean_menu_typo_font_weight_mobile":"","ocean_menu_typo_transform":"","ocean_menu_typo_transform_tablet":"","ocean_menu_typo_transform_mobile":"","ocean_menu_typo_line_height":0,"ocean_menu_typo_line_height_tablet":0,"ocean_menu_typo_line_height_mobile":0,"ocean_menu_typo_line_height_unit":"","ocean_menu_typo_spacing":0,"ocean_menu_typo_spacing_tablet":0,"ocean_menu_typo_spacing_mobile":0,"ocean_menu_typo_spacing_unit":"","ocean_menu_link_color":"","ocean_menu_link_color_hover":"","ocean_menu_link_color_active":"","ocean_menu_link_background":"","ocean_menu_link_hover_background":"","ocean_menu_link_active_background":"","ocean_menu_social_links_bg":"","ocean_menu_social_hover_links_bg":"","ocean_menu_social_links_color":"","ocean_menu_social_hover_links_color":"","ocean_disable_title":"default","ocean_disable_heading":"default","ocean_post_title":"","ocean_post_subheading":"","ocean_post_title_style":"","ocean_post_title_background_color":"","ocean_post_title_background":0,"ocean_post_title_bg_image_position":"","ocean_post_title_bg_image_attachment":"","ocean_post_title_bg_image_repeat":"","ocean_post_title_bg_image_size":"","ocean_post_title_height":0,"ocean_post_title_bg_overlay":0.5,"ocean_post_title_bg_overlay_color":"","ocean_disable_breadcrumbs":"default","ocean_breadcrumbs_color":"","ocean_breadcrumbs_separator_color":"","ocean_breadcrumbs_links_color":"","ocean_breadcrumbs_links_hover_color":"","ocean_display_footer_widgets":"default","ocean_display_footer_bottom":"default","ocean_custom_footer_template":"","_jetpack_memberships_contains_paid_content":false,"ocean_post_oembed":"","ocean_post_self_hosted_media":"","ocean_post_video_embed":"","ocean_link_format":"","ocean_link_format_target":"self","ocean_quote_format":"","ocean_quote_format_link":"post","ocean_gallery_link_images":"on","ocean_gallery_id":[],"footnotes":""},"categories":[2],"tags":[],"class_list":["post-3008","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia","entry","has-media"],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/xclusiva.com.co\/wp-content\/uploads\/2025\/06\/chat-gpt-1.webp?fit=2560%2C1440&ssl=1","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/posts\/3008","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=3008"}],"version-history":[{"count":1,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/posts\/3008\/revisions"}],"predecessor-version":[{"id":3013,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/posts\/3008\/revisions\/3013"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=\/wp\/v2\/media\/3012"}],"wp:attachment":[{"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=3008"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=3008"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/xclusiva.com.co\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=3008"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}