network trains and tests but slow? -- investigate

2019-12-01 11:26:54 -08:00
parent b115077c3b
commit 4bf66bf85e
3 changed files with 59 additions and 49 deletions
--- a/bridge.pyx
+++ b/bridge.pyx
@@ -9,8 +9,9 @@ from libc.string cimport memcpy
 import library as nn
 X_train, y_train, X_test, y_test = nn.load_mnist()
 tokenizers = {}
 X_test = None
 y_test = None
 cdef extern from "numpy/arrayobject.h":
@@ -74,20 +75,18 @@ cdef public void f_idx_list_to_print(float* f_idxs, size_t num):
    # return retval
-cdef public void c_onehot(float* y, float* idxs, size_t n_idx):
+cdef public void cbow_batch(
-    oh = nn.onehot(np.asarray(<float[:n_idx]>idxs), nc=len(nn.vocab))
+    float* X, float* y, float* idxs, size_t bs, size_t win
-    ensure_contiguous(oh)
+):
    memcpy(y, PyArray_DATA(oh), oh.size * sizeof(float))
    # eprint(np.argmax(oh, axis=1))
 cdef public void c_slices(float* X, float* idxs, size_t bs, size_t win):
    X_np = np.asarray(<float[:bs,:2*win]>X)
    idxs_np = np.asarray(<float[:bs + 2*win]>idxs)
    # Deal with X
    X_np = np.asarray(<float[:bs,:2*win]>X)
    for r in range(bs):
        X_np[r, :win] = idxs_np[r:r+win]
        X_np[r, win:] = idxs_np[r+win+1:r+win+1+win]
-    # eprint(X_np)
+
    # Deal with y
    nn.onehot(np.asarray(<float[:bs, :len(nn.vocab)]>y), idxs_np[win:-win])
 cdef public void debug_print(object o):
@@ -121,26 +120,6 @@ cdef public float eval_net(object net):
    return net.evaluate(X_test, y_test, verbose=False)
 cdef public void mnist_batch(float* X, float* y, size_t bs,
                             int part, int total):
    if total == 0:
        X_pool, y_pool = X_train, y_train
    else:
        partsize = len(X_train) // total
        X_pool = X_train[part*partsize:(part+1)*partsize]
        y_pool = y_train[part*partsize:(part+1)*partsize]
    idx = np.random.choice(len(X_pool), bs, replace=True)
    X_r = X_pool[idx]
    y_r = y_pool[idx]
    assert X_r.flags['C_CONTIGUOUS']
    assert y_r.flags['C_CONTIGUOUS']
    memcpy(X, PyArray_DATA(X_r), X_r.size * sizeof(float))
    memcpy(y, PyArray_DATA(y_r), y_r.size * sizeof(float))
 cdef public void init_weightlist_like(WeightList* wl, object net):
    weights = net.get_weights()
    wl.n_weights = len(weights)
@@ -177,6 +156,10 @@ cdef public void combo_weights(
            wf += alpha * ww
 cdef public void create_test_dataset(size_t win):
    _create_test_dataset(win)
 cdef list wrap_weight_list(WeightList* wl):
    weights = []
    for i in range(wl.n_weights):
@@ -221,3 +204,9 @@ def ensure_contiguous(a):
 def eprint(*args, **kwargs):
    return print(*args, flush=True, **kwargs)
 def _create_test_dataset(win):
    global X_test, y_test
    if X_test is None or y_test is None:
        X_test, y_test = nn.create_test_dataset(win)
--- a/library.py
+++ b/library.py
@@ -1,16 +1,9 @@
 import os
 os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'
 import numpy as np
 import tensorflow as tf
 tf.compat.v1.logging.set_verbosity(tf.compat.v1.logging.ERROR)  # STFU!
 # from nltk.corpus import stopwords
 # from nltk.tokenize import word_tokenize
 from mynet import load_mnist, onehot
 def word_tokenize(s: str):
    l = ''.join(c.lower() if c.isalpha() else ' ' for c in s)
    return l.split()
 HERE = os.path.abspath(os.path.dirname(__file__))
@@ -20,10 +13,38 @@ VOCAB = os.path.join(HERE, 'vocab.txt')
 vocab = {
    w: i for i, w in enumerate(open(VOCAB).read().splitlines(keepends=False))
 }
 # inv_vocab = [vocab[i] for i in range(len(vocab))]
 inv_vocab = sorted(vocab, key=vocab.get)
 def onehot(oh_store, idx):
    oh_store[:] = 0
    oh_store[np.arange(len(idx)), idx.astype(np.int)] = 1
 def word_tokenize(s: str):
    l = ''.join(c.lower() if c.isalpha() else ' ' for c in s)
    return l.split()
 def create_test_dataset(win):
    S = 1000
    with open(CORPUS) as f:
        ds = np.array([vocab[w] for w in word_tokenize(f.read())
                       if w in vocab])
    idx = np.random.choice(np.arange(win, len(ds) - win), S)
    oh_store = np.zeros((S, len(vocab)), dtype=np.float32)
    onehot(oh_store, ds[idx])
    return (
        # X
        np.stack([
            np.concatenate([ds[i-win:i], ds[i+1:i+win+1]])
            for i in idx
        ], axis=0).astype(np.float32),
        #y
        oh_store
    )
 def create_mnist_network():
    model = tf.keras.models.Sequential([
        tf.keras.layers.Dense(30, input_shape=(784,), activation='relu'),
@@ -35,8 +56,8 @@ def create_mnist_network():
 def create_cbow_network(win, embed):
-    ctxt = tf.keras.layers.Input(shape=[win])
+    ctxt = tf.keras.layers.Input(shape=[2*win])
-    ed = tf.keras.layers.Embedding(len(vocab), embed, input_length=win)(ctxt)
+    ed = tf.keras.layers.Embedding(len(vocab), embed, input_length=2*win)(ctxt)
    cbow = tf.keras.layers.Lambda(lambda x: tf.reduce_mean(x, axis=1))(ed)
    blowup = tf.keras.layers.Dense(len(vocab), activation='softmax')(cbow)
    mod = tf.keras.Model(inputs=ctxt, outputs=blowup)
@@ -44,7 +65,6 @@ def create_cbow_network(win, embed):
        optimizer='sgd',
        loss='categorical_crossentropy',
    )
    print(mod, flush=True)
    return mod
--- a/main.c
+++ b/main.c
@@ -15,9 +15,9 @@
 #define TAG_SWORD 7
 #define TAG_IWORD 8
-#define COMM 1
+#define COMM 5
-#define ITER 1
+#define ITER 200
-#define BS 10
+#define BS 32
 #define EMB 20
 #define WIN 2
 #define FSPC 1
@@ -241,6 +241,7 @@ void slave_node() {
    int me = my_mpi_id();
    PyObject* net = create_network(WIN, EMB);
    create_test_dataset(WIN);
    WeightList wl;
    init_weightlist_like(&wl, net);
@@ -264,11 +265,11 @@ void slave_node() {
            MPI_Recv(f_widx, n_words, MPI_FLOAT,
                    mpi_id_from_role_id(BATCHER, 0), TAG_BATCH, MPI_COMM_WORLD,
                    MPI_STATUS_IGNORE);
-            c_slices(X, f_widx, BS, WIN);
+            cbow_batch(X, y, f_widx, BS, WIN);
            c_onehot(y, f_widx + WIN, BS);
            step_net(net, X, y, BS);
            INFO_PRINTLN(".");
        }
-        // printf("%d net: %f\n", my_mpi_id(), eval_net(net));
+        printf("%d net: %f\n", my_mpi_id(), eval_net(net));
        update_weightlist(&wl, net);
        // send_weights(&wl, mpi_id_from_role_id(MASTER, 0), TAG_WEIGH);
    }