implemented some kind of dispatching

2019-12-01 17:49:09 -08:00
parent bc6d34e253
commit b2a4681fb2
2 changed files with 67 additions and 65 deletions
--- a/bridge.pyx
+++ b/bridge.pyx
@@ -52,7 +52,9 @@ cdef public int get_tokens(WordList* wl, const char *filename):
    try:
        words = next(g)
    except StopIteration:
-        return 0
+        tokenizers[fnu] = nn.token_generator(fnu)
        g = tokenizers[fnu]
        words = next(g)
    words_into_wordlist(wl, words)
    return 1
@@ -69,16 +71,17 @@ cdef public void f_idx_list_to_print(float* f_idxs, size_t num):
    idxs = np.asarray(<float[:num]>f_idxs).astype(np.int)
    cdef str pyuni = ' '.join(nn.inv_vocab[i] for i in idxs)
    print(pyuni)
    # cdef bytes b = pyuni.encode('utf-8')
    # cdef char* retval = <char*>malloc((len(b) + 1) * sizeof(char))
    # retval[len(b)] = 0
    # return retval
 cdef public void debug_print(object o):
    eprint(o)
 cdef public void randidx(int* idx, size_t l, size_t how_much):
    i_np = np.random.choice(l, how_much, replace=False).astype(np.intc)
    memcpy(idx, PyArray_DATA(i_np), how_much * sizeof(int))
 cdef public object create_network(int win, int embed):
    try:
        return nn.create_cbow_network(win, embed)
--- a/main.c
+++ b/main.c
@@ -14,13 +14,14 @@
 #define TAG_STLEN 6
 #define TAG_SWORD 7
 #define TAG_IWORD 8
 #define TAG_INSTR 9
-#define COMM 10
+#define COMM 50
-#define ITER 100
+#define ITER 50
 #define BS 32
 #define EMB 20
 #define WIN 2
-#define FSPC 1
+#define FLPC 0.8
 #define in_range(i, x) (size_t (i) = 0; (i) < (x); (i)++)
 // I am honestly VERY sorry for this but power corrupts even the best of us
@@ -29,15 +30,17 @@
    do { fprintf(stderr, fmt, __VA_ARGS__); } while(0)
 #define INFO_PRINTLN(what) \
    do { fprintf(stderr, "%s\n", what); } while(0)
 #define INFO_PRINT(what) \
    do { fprintf(stderr, "%s", what); } while(0)
-// char_stream -> tokenize -> word_strem -> filter + batch -> slave network
+int g_argc = 1;
 typedef enum{
    TOKENIZER,
    FILTERER,
    BATCHER,
    LEARNER,
-    MASTER
+    DISPATCHER
 } Role;
 int world_size() {
@@ -55,7 +58,11 @@ int my_mpi_id() {
 size_t number_of(Role what) {
    switch (what) {
        case TOKENIZER:
-            return 1;
+            if (g_argc < 2) {
                INFO_PRINTLN("NOT ENOUGH INPUTS!");
                exit(1);
            }
            return g_argc - 1;
        case FILTERER:
            return 1;
        case BATCHER:
@@ -65,10 +72,9 @@ size_t number_of(Role what) {
                - number_of(TOKENIZER)
                - number_of(FILTERER)
                - number_of(BATCHER)
-                - number_of(MASTER);
+                - number_of(DISPATCHER);
-        case MASTER:
+        case DISPATCHER:
-            return 0;
+            return 1;
 #warning "set to real number of masters!"
    }
 }
@@ -93,10 +99,11 @@ int role_id_from_mpi_id(Role role, int mid) {
 Role map_node() {
    int node = my_mpi_id();
    size_t base = 0;
-    for (Role r = TOKENIZER; r <= MASTER; r++) {
+    for (Role r = TOKENIZER; r <= DISPATCHER; r++) {
        if (node < number_of(r) + base) return r;
        base += number_of(r);
    }
    INFO_PRINTF("Something went wrong for node %d\n", node);
    exit(1);  // this is bad
 }
@@ -121,8 +128,9 @@ void send_word(Word* w, int dest) {
    MPI_Send(w->data, len + 1, MPI_CHAR, dest, TAG_SWORD, MPI_COMM_WORLD);
 }
-void recv_word(Word* w, int src) {
+int recv_word(Word* w, int src) {
    long len;
    MPI_Status stat;
    MPI_Recv(&len, 1, MPI_LONG, src, TAG_STLEN, MPI_COMM_WORLD,
            MPI_STATUS_IGNORE);
    if (w->mem < len + 1) {
@@ -130,7 +138,8 @@ void recv_word(Word* w, int src) {
        w->data = realloc(w->data, sizeof(char) * w->mem);
    }
    MPI_Recv(w->data, len + 1, MPI_CHAR, src, TAG_SWORD, MPI_COMM_WORLD,
-            MPI_STATUS_IGNORE);
+            &stat);
    return stat.MPI_SOURCE;
 }
 void tokenizer(const char* source) {
@@ -170,8 +179,6 @@ void filterer() {
 }
 void batcher() {
    // Reads some data and converts it to a float array
    // INFO_PRINTF("Starting batcher %d\n", getpid());
    int s = 0;
    const size_t entry_size = 2 * WIN + 1;
    const size_t bufsize = BS * entry_size;
@@ -189,10 +196,11 @@ void batcher() {
            }
        }
        if (l_wid[0] == -1) break;
-
+        INFO_PRINT(".");
        MPI_Recv(&s, 1, MPI_INT, MPI_ANY_SOURCE, TAG_READY, MPI_COMM_WORLD,
                MPI_STATUS_IGNORE);
        MPI_Send(batch, bufsize, MPI_FLOAT, s, TAG_BATCH, MPI_COMM_WORLD);
        INFO_PRINTLN("!");
    }
    free(l_wid);
    free(batch);
@@ -206,7 +214,7 @@ void free_weightlist(WeightList* wl) {
    free(wl->weights);
 }
-void send_weights(const WeightList* wl, int dest, int tag) {
+void send_weights(const WeightList* wl, int dest) {
    // This assumes that the receiving end knows exactly
    // the number of elements being sent and has memory ready
    // for it.
@@ -215,11 +223,12 @@ void send_weights(const WeightList* wl, int dest, int tag) {
        for in_range(k, wl->weights[i].dims) {
            n_el *= wl->weights[i].shape[k];
        }
-        MPI_Send(wl->weights[i].W, n_el, MPI_FLOAT, dest, tag, MPI_COMM_WORLD);
+        MPI_Send(wl->weights[i].W, n_el, MPI_FLOAT, dest,
                TAG_WEIGH, MPI_COMM_WORLD);
    }
 }
-void recv_weights(WeightList* wl, int src, int tag) {
+void recv_weights(WeightList* wl, int src) {
    // This assumes that the sender sends stuff that is going
    // to fit into memory in correct order too.
    for in_range(i, wl->n_weights) {
@@ -227,17 +236,12 @@ void recv_weights(WeightList* wl, int src, int tag) {
        for in_range(d, wl->weights[i].dims) {
            n_el *= wl->weights[i].shape[d];
        }
-        MPI_Recv(wl->weights[i].W, n_el, MPI_FLOAT, src, tag, MPI_COMM_WORLD,
+        MPI_Recv(wl->weights[i].W, n_el, MPI_FLOAT, src,
-                MPI_STATUS_IGNORE);
+                TAG_WEIGH, MPI_COMM_WORLD, MPI_STATUS_IGNORE);
    }
 }
 void learner() {
    // 0. Announce readiness?
    // 1. Receive weights from master ([ ] has to know its master)
    // 2. Request batch from reader ([ ] has to choose a reader)
    // 3. Do computations
    // 4. Send weights back to master
    INFO_PRINTF("Starting slave %d\n", getpid());
    int me = my_mpi_id();
@@ -251,6 +255,8 @@ void learner() {
    float* batch = malloc(bufsize * sizeof(float));
    for in_range(i, COMM) {
        recv_weights(&wl, mpi_id_from_role_id(DISPATCHER, 0));
        set_net_weights(net, &wl);
        for in_range(k, ITER) {
            MPI_Send(&me, 1, MPI_INT, mpi_id_from_role_id(BATCHER, 0),
                    TAG_READY, MPI_COMM_WORLD);
@@ -259,61 +265,50 @@ void learner() {
                    MPI_STATUS_IGNORE);
            step_net(net, batch, BS);
        }
-        printf("%d net: %f\n", my_mpi_id(), eval_net(net));
+        // printf("%d net: %f\n", my_mpi_id(), eval_net(net));
        update_weightlist(&wl, net);
        send_weights(&wl, mpi_id_from_role_id(DISPATCHER, 0));
    }
    Py_DECREF(net);
    free_weightlist(&wl);
    free(batch);
 }
-void master_node() {
+void dispatcher() {
    // 0. Initialize model
    // 1. Send it to some slaves for processing (synchronous)
    // 2. Receive weights back (synchronous)
    // 3. Average the weights
    PyObject* frank = create_network(WIN, EMB);
    create_test_dataset(WIN);
    WeightList wl;
    init_weightlist_like(&wl, frank);
    update_weightlist(&wl, frank);
-    int spr = number_of(LEARNER) * FSPC;  // Slaves per round
+    int lpr = number_of(LEARNER) * FLPC;  // Learners per round
    int s;
-    WeightList *wls = malloc(sizeof(WeightList) * spr);
+    WeightList *wls = malloc(sizeof(WeightList) * lpr);
-    int *handles = malloc(sizeof(int) * spr);
+    int *round = malloc(sizeof(int) * lpr);
-    for in_range(i, spr) {
+    for in_range(i, lpr) {
        init_weightlist_like(wls + i, frank);
    }
    for in_range(i, COMM) {
        randidx(round, number_of(LEARNER), lpr);
-        for in_range(k, spr) {
+        for in_range(k, lpr) {
-            MPI_Recv(&s, 1, MPI_INT, MPI_ANY_SOURCE, TAG_READY, MPI_COMM_WORLD,
+            // INFO_PRINTF(" %5d", round[k]);
-                    MPI_STATUS_IGNORE);
+            send_weights(&wl, mpi_id_from_role_id(LEARNER, round[k]));
            send_weights(&wl, s, TAG_WEIGH);
            handles[k] = s;
        }
-        for in_range(k, spr) {
+        // INFO_PRINTLN("");
-            recv_weights(wls + k, handles[k], TAG_WEIGH);
+        for in_range(k, lpr) {
            recv_weights(wls + k, mpi_id_from_role_id(LEARNER, round[k]));
        }
-        combo_weights(&wl, wls, spr);
+        combo_weights(&wl, wls, lpr);
        set_net_weights(frank, &wl);
-        printf("Frank: %f\n", eval_net(frank));
+        // printf("Frank: %f\n", eval_net(frank));
    }
    Py_DECREF(frank);
    free_weightlist(&wl);
-    for in_range(i, spr) free_weightlist(wls + i);
+    for in_range(i, lpr) free_weightlist(wls + i);
    free(wls);
-    // if (role_id_from_mpi_id(my_mpi_id(), MASTER) == 0) {
+    free(round);
        // for in_range(r, number_of(BATCHER)) {
            // int stop = -1;
            // MPI_Send(&stop, 1, MPI_INT, reader_id(r), TAG_READY,
                    // MPI_COMM_WORLD);
        // }
    // }
 }
 int main (int argc, const char **argv) {
@@ -326,9 +321,12 @@ int main (int argc, const char **argv) {
    PyObject* bridge_module = PyImport_ImportModule("bridge");
    // Actual Code
    int role_id;
    g_argc = argc;
    switch (map_node()) {
        case TOKENIZER:
-            tokenizer(argv[1]);
+            role_id = role_id_from_mpi_id(TOKENIZER, my_mpi_id());
            tokenizer(argv[role_id + 1]);
            break;
        case FILTERER:
            filterer();
@@ -339,10 +337,11 @@ int main (int argc, const char **argv) {
        case LEARNER:
            learner();
            break;
        case DISPATCHER:
            dispatcher();
            break;
        default:
            INFO_PRINTLN("DYING HORRIBLY!");
        // case SLAVE: slave_node(); break;
        // case MASTER: master_node(); break;
    }
    // Finalizing Boilerplate