ClusterLabs · wenningerk · Dec 9, 2019 · Dec 17, 2019 · kgaillot · Dec 11, 2019
diff --git a/daemons/pacemakerd/pacemakerd.c b/daemons/pacemakerd/pacemakerd.c
@@ -48,8 +48,14 @@ static bool global_keep_tracking = false;
 static const char *local_name = NULL;
 static uint32_t local_nodeid = 0;
 static crm_trigger_t *shutdown_trigger = NULL;
+static crm_trigger_t *startup_trigger = NULL;
 static const char *pid_file = PCMK_RUN_DIR "/pacemaker.pid";
 
+static const char *pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_INIT;
+static gboolean running_with_sbd = FALSE;
+static uint shutdown_complete_state_reported_to = 0;
+static gboolean shutdown_complete_state_reported_client_closed = FALSE;
+
 typedef struct pcmk_child_s {
     int pid;
     long flag;
@@ -435,21 +441,20 @@ escalate_shutdown(gpointer data)
 static gboolean
 pcmk_shutdown_worker(gpointer user_data)
 {
-    static int phase = 0;
+    static int phase = SIZEOF(pcmk_children);
     static time_t next_log = 0;
-    static int max = SIZEOF(pcmk_children);
 
     int lpc = 0;
 
-    if (phase == 0) {
+    if (phase == SIZEOF(pcmk_children)) {
         crm_notice("Shutting down Pacemaker");
-        phase = max;
+        pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_SHUTTINGDOWN;
     }
 
     for (; phase > 0; phase--) {
         /* Don't stop anything with start_seq < 1 */
 
-        for (lpc = max - 1; lpc >= 0; lpc--) {
+        for (lpc = SIZEOF(pcmk_children) - 1; lpc >= 0; lpc--) {
             pcmk_child_t *child = &(pcmk_children[lpc]);
 
             if (phase != child->start_seq) {
@@ -497,6 +502,11 @@ pcmk_shutdown_worker(gpointer user_data)
 
     /* send_cluster_id(); */
     crm_notice("Shutdown complete");
+    pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_SHUTDOWNCOMPLETE;
+    if (!fatal_error && running_with_sbd &&
+        !shutdown_complete_state_reported_client_closed) {
+        return TRUE;
+    }
 
     {
         const char *delay = daemon_option("shutdown_delay");
@@ -553,6 +563,50 @@ pcmk_ipc_created(qb_ipcs_connection_t * c)
     crm_trace("Connection %p", c);
 }
 
+static void
+pcmk_handle_ping_request(crm_client_t *c, xmlNode *msg, uint32_t id)
+{
+    const char *value = NULL;
+    xmlNode *ping = NULL;
+    xmlNode *reply = NULL;
+    time_t pinged = time(NULL);
+    const char *from = crm_element_value(msg, F_CRM_SYS_FROM);
+
+    /* Pinged for status */
+    crm_trace("Pinged from %s.%s",
+              crm_element_value(msg, F_CRM_ORIGIN),
+              from?from:"unknown");
+    ping = create_xml_node(NULL, XML_CRM_TAG_PING);
+    value = crm_element_value(msg, F_CRM_SYS_TO);
+    crm_xml_add(ping, XML_PING_ATTR_SYSFROM, value);
+    crm_xml_add(ping, XML_PING_ATTR_PACEMAKERDSTATE, pacemakerd_state);
+    crm_xml_add_ll(ping, XML_ATTR_TSTAMP, (long long) pinged);
+    crm_xml_add(ping, XML_PING_ATTR_STATUS, "ok");
+    reply = create_reply(msg, ping);
+    free_xml(ping);
+    if (reply) {
+        if (crm_ipcs_send(c, id, reply, crm_ipc_server_event) <= 0) {
+            crm_err("Failed sending ping-reply");
+        }
+        free_xml(reply);
+    } else {
+        crm_err("Failed building ping-reply");
+    }
+    /* just proceed state on sbd pinging us */
+    if (from && strstr(from, "sbd")) {
+        if (crm_str_eq(pacemakerd_state,
+                       XML_PING_ATTR_PACEMAKERDSTATE_SHUTDOWNCOMPLETE,
+                       TRUE)) {
+            shutdown_complete_state_reported_to = c->pid;
+        } else if (crm_str_eq(pacemakerd_state,
+                              XML_PING_ATTR_PACEMAKERDSTATE_WAITPING,
+                              TRUE)) {
+            pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_STARTINGDAEMONS;
+            mainloop_set_trigger(startup_trigger);
+        }
+    }
+}
+
 /* Exit code means? */
 static int32_t
 pcmk_ipc_dispatch(qb_ipcs_connection_t * qbc, void *data, size_t size)
@@ -563,35 +617,44 @@ pcmk_ipc_dispatch(qb_ipcs_connection_t * qbc, void *data, size_t size)
     crm_client_t *c = crm_client_get(qbc);
     xmlNode *msg = crm_ipcs_recv(c, data, size, &id, &flags);
 
-    crm_ipcs_send_ack(c, id, flags, "ack", __FUNCTION__, __LINE__);
-    if (msg == NULL) {
-        return 0;
+    if (msg != NULL) {
+        task = crm_element_value(msg, F_CRM_TASK);
     }
 
-    task = crm_element_value(msg, F_CRM_TASK);
-    if (crm_str_eq(task, CRM_OP_QUIT, TRUE)) {
-        /* Time to quit */
-        crm_notice("Shutting down in response to ticket %s (%s)",
-                   crm_element_value(msg, F_CRM_REFERENCE), crm_element_value(msg, F_CRM_ORIGIN));
-        pcmk_shutdown(15);
+    if (crm_str_eq(task, CRM_OP_PING, TRUE)) {
+        pcmk_handle_ping_request(c, msg, id);
+    } else {
+        crm_ipcs_send_ack(c, id, flags, "ack", __FUNCTION__, __LINE__);
 
-    } else if (crm_str_eq(task, CRM_OP_RM_NODE_CACHE, TRUE)) {
-        /* Send to everyone */
-        struct iovec *iov;
-        int id = 0;
-        const char *name = NULL;
+        if (msg == NULL) {
+            return 0;
+        }
 
-        crm_element_value_int(msg, XML_ATTR_ID, &id);
-        name = crm_element_value(msg, XML_ATTR_UNAME);
-        crm_notice("Instructing peers to remove references to node %s/%u", name, id);
+        if (crm_str_eq(task, CRM_OP_QUIT, TRUE)) {
+            /* Time to quit */
+            crm_notice("Shutting down in response to ticket %s (%s)",
+                       crm_element_value(msg, F_CRM_REFERENCE),
+                       crm_element_value(msg, F_CRM_ORIGIN));
+            pcmk_shutdown(15);
 
-        iov = calloc(1, sizeof(struct iovec));
-        iov->iov_base = dump_xml_unformatted(msg);
-        iov->iov_len = 1 + strlen(iov->iov_base);
-        send_cpg_iov(iov);
+        } else if (crm_str_eq(task, CRM_OP_RM_NODE_CACHE, TRUE)) {
+            /* Send to everyone */
+            struct iovec *iov;
+            int id = 0;
+            const char *name = NULL;
 
-    } else {
-        update_process_clients(c);
+            crm_element_value_int(msg, XML_ATTR_ID, &id);
+            name = crm_element_value(msg, XML_ATTR_UNAME);
+            crm_notice("Instructing peers to remove references to node %s/%u", name, id);
+
+            iov = calloc(1, sizeof(struct iovec));
+            iov->iov_base = dump_xml_unformatted(msg);
+            iov->iov_len = 1 + strlen(iov->iov_base);
+            send_cpg_iov(iov);
+
+        } else {
+            update_process_clients(c);
+        }
     }
 
     free_xml(msg);
@@ -608,6 +671,12 @@ pcmk_ipc_closed(qb_ipcs_connection_t * c)
         return 0;
     }
     crm_trace("Connection %p", c);
+    if (shutdown_complete_state_reported_to == client->pid) {
+        shutdown_complete_state_reported_client_closed = TRUE;
+        if (shutdown_trigger) {
+            mainloop_set_trigger(shutdown_trigger);
+        }
+    }
     crm_client_destroy(client);
     return 0;
 }
@@ -1051,8 +1120,8 @@ find_and_track_existing_processes(void)
     return (tracking > INT_MAX) ? INT_MAX : tracking;
 }
 
-static void
-init_children_processes(void)
+static gboolean
+init_children_processes(gpointer user_data)
 {
     int start_seq = 1, lpc = 0;
     static int max = SIZEOF(pcmk_children);
@@ -1078,6 +1147,8 @@ init_children_processes(void)
      * This may be useful for the daemons to know
      */
     setenv("PCMK_respawned", "true", 1);
+    pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_RUNNING;
+    return TRUE;
 }
 
 static void
@@ -1356,6 +1427,7 @@ main(int argc, char **argv)
 
     if(pcmk_locate_sbd() > 0) {
         setenv("PCMK_watchdog", "true", 1);
+        running_with_sbd = TRUE;
     } else {
         setenv("PCMK_watchdog", "false", 1);
     }
@@ -1394,7 +1466,13 @@ main(int argc, char **argv)
         mainloop_add_signal(SIGTERM, pcmk_shutdown);
         mainloop_add_signal(SIGINT, pcmk_shutdown);
 
-        init_children_processes();
+        if (running_with_sbd) {
+            pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_WAITPING;
+            startup_trigger = mainloop_add_trigger(G_PRIORITY_HIGH, init_children_processes, NULL);
+        } else {
+            pacemakerd_state = XML_PING_ATTR_PACEMAKERDSTATE_STARTINGDAEMONS;
+            init_children_processes(NULL);
+        }
 
         crm_notice("Pacemaker daemon successfully started and accepting connections");
         g_main_loop_run(mainloop);

diff --git a/include/crm/common/Makefile.am b/include/crm/common/Makefile.am
@@ -12,7 +12,7 @@ MAINTAINERCLEANFILES = Makefile.in
 headerdir=$(pkgincludedir)/crm/common
 
 header_HEADERS = xml.h ipc.h util.h iso8601.h mainloop.h logging.h results.h \
-		 nvpair.h
+		 nvpair.h pacemakerd_types.h
 noinst_HEADERS = cib_secrets.h ipcs.h internal.h alerts_internal.h \
 		 iso8601_internal.h remote_internal.h xml_internal.h \
 		 ipc_internal.h output.h cmdline_internal.h curses_internal.h
diff --git a/include/crm/common/pacemakerd_types.h b/include/crm/common/pacemakerd_types.h
@@ -0,0 +1,70 @@
+/*
+ * Copyright 2004-2019 the Pacemaker project contributors
+ *
+ * The version control history for this file may have further details.
+ *
+ * This source code is licensed under the GNU Lesser General Public License
+ * version 2.1 or later (LGPLv2.1+) WITHOUT ANY WARRANTY.
+ */
+
+#ifndef PACEMAKERD_TYPES__H
+#  define PACEMAKERD_TYPES__H
+
+#ifdef __cplusplus
+extern "C" {
+#endif
+
+#include <time.h>
+
+enum pacemakerd_conn_state {
+    pacemakerd_conn_connected,
+    pacemakerd_conn_disconnected
+};
+
+enum pacemakerd_state {
+    pacemakerd_state_invalid = -1,
+    pacemakerd_state_init = 0,
+    pacemakerd_state_starting_daemons,
+    pacemakerd_state_wait_for_ping,
+    pacemakerd_state_running,
+    pacemakerd_state_shutting_down,
+    pacemakerd_state_shutdown_complete,
+    pacemakerd_state_max = pacemakerd_state_shutdown_complete,
+};
+
+typedef struct pacemakerd_s pacemakerd_t;
+
+typedef struct pacemakerd_api_operations_s {
+    int (*connect) (pacemakerd_t *pacemakerd, const char *name);
+    int (*disconnect) (pacemakerd_t *pacemakerd);
+    void (*free) (pacemakerd_t *pacemakerd);
+    int (*set_ping_callback) (pacemakerd_t *pacemakerd,
+                              void (*callback) (pacemakerd_t *pacemakerd,
+                                                time_t last_good,
+                                                enum pacemakerd_state state,
+                                                int rc, gpointer userdata),
+                              gpointer userdata);
+    int (*set_disconnect_callback) (pacemakerd_t *pacemakerd,
+                                    void (*callback) (gpointer userdata),
+                                    gpointer userdata
+                                    );
+    int (*ping) (pacemakerd_t *pacemakerd, const char *name,
+                 const char *admin_uuid, int call_options);
+} pacemakerd_api_operations_t;
+
+struct pacemakerd_s {
+    enum pacemakerd_conn_state conn_state;
+    void *pacemakerd_private;
+    pacemakerd_api_operations_t *cmds;
+};
+
+pacemakerd_t * pacemakerd_api_new(void);
+void pacemakerd_api_delete(pacemakerd_t * pacemakerd);
+enum pacemakerd_state pacemakerd_state_text2enum(const char *state);
+const char *pacemakerd_state_enum2text(enum pacemakerd_state state);
+
+#ifdef __cplusplus
+}
+#endif
+
+#endif // PACEMAKERD_TYPES__H
diff --git a/include/crm/msg_xml.h b/include/crm/msg_xml.h
@@ -123,6 +123,13 @@ extern "C" {
 #  define XML_PING_ATTR_STATUS		"result"
 #  define XML_PING_ATTR_SYSFROM		"crm_subsystem"
 #  define XML_PING_ATTR_CRMDSTATE   "crmd_state"
+#  define XML_PING_ATTR_PACEMAKERDSTATE "pacemakerd_state"
+#  define XML_PING_ATTR_PACEMAKERDSTATE_INIT "init"
+#  define XML_PING_ATTR_PACEMAKERDSTATE_STARTINGDAEMONS "starting_daemons"
+#  define XML_PING_ATTR_PACEMAKERDSTATE_WAITPING "wait_for_ping"
+#  define XML_PING_ATTR_PACEMAKERDSTATE_RUNNING "running"
+#  define XML_PING_ATTR_PACEMAKERDSTATE_SHUTTINGDOWN "shutting_down"
+#  define XML_PING_ATTR_PACEMAKERDSTATE_SHUTDOWNCOMPLETE "shutdown_complete"
 
 #  define XML_TAG_FRAGMENT		"cib_fragment"
 

diff --git a/lib/common/Makefile.am b/lib/common/Makefile.am
@@ -68,6 +68,7 @@ libcrmcommon_la_SOURCES	+= utils.c
 libcrmcommon_la_SOURCES	+= watchdog.c
 libcrmcommon_la_SOURCES	+= xml.c
 libcrmcommon_la_SOURCES	+= xpath.c
+libcrmcommon_la_SOURCES	+= pacemakerd_client.c
 
 # It's possible to build the library adding ../gnu/md5.c directly to SOURCES,
 # but distclean chokes on that because it tries to include the source's .Plo