From 3f4e60b4992a85bfa314538022fd67dfa36360b9 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 23 Jan 2018 21:55:30 +0100
Subject: [PATCH 01/28] MAINT: prepare for release 3.1.4

---
 setup.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/setup.py b/setup.py
index 06db2fa..3a5e34d 100644
--- a/setup.py
+++ b/setup.py
@@ -1,7 +1,7 @@
 #!/usr/bin/env python
 from setuptools import setup, find_packages  # This setup relies on setuptools since distutils is insufficient and badly hacked code
 
-version = '3.1.3'
+version = '3.1.4'
 author = 'David-Leon Pohl, Jens Janssen'
 author_email = 'pohl@physik.uni-bonn.de, janssen@physik.uni-bonn.de'
 

From 4bbe0935a56bd8fe7859978920160d1911313cae Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Thu, 19 Sep 2019 13:38:53 +0200
Subject: [PATCH 02/28] PRJ: bump version to 3.1.5.dev0

---
 setup.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/setup.py b/setup.py
index 3a5e34d..fcfaf05 100644
--- a/setup.py
+++ b/setup.py
@@ -1,7 +1,7 @@
 #!/usr/bin/env python
 from setuptools import setup, find_packages  # This setup relies on setuptools since distutils is insufficient and badly hacked code
 
-version = '3.1.4'
+version = '3.1.5.dev0'
 author = 'David-Leon Pohl, Jens Janssen'
 author_email = 'pohl@physik.uni-bonn.de, janssen@physik.uni-bonn.de'
 

From 4b40c44770191333da1adeacbbe62c8733e18e22 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 26 Jun 2018 15:14:53 +0200
Subject: [PATCH 03/28] ENH: allow clustering with coordinates

---
 pixel_clusterizer/cluster_functions.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/pixel_clusterizer/cluster_functions.py b/pixel_clusterizer/cluster_functions.py
index bf54c0b..ceefab5 100644
--- a/pixel_clusterizer/cluster_functions.py
+++ b/pixel_clusterizer/cluster_functions.py
@@ -13,8 +13,8 @@ def _new_event(event_number_1, event_number_2):
 def _pixel_masked(hit, array):
     ''' Checks whether a hit (column/row) is masked or not. Array is 2D array with boolean elements corresponding to pixles indicating whether a pixel is disabled or not.
     '''
-    if array.shape[0] > hit["column"] and array.shape[1] > hit["row"]:
-        return array[hit["column"], hit["row"]]
+    if hit["column"] >= 0 and hit["row"] >= 0 and array.shape[0] > int(hit["column"]) and array.shape[1] > int(hit["row"]):
+        return array[int(hit["column"]), int(hit["row"])]
     else:
         return False
 

From c6668586a7310b1eaf9f4cbf902dc38b1c0b079a Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 26 Jun 2018 17:32:22 +0200
Subject: [PATCH 04/28] ENH: fuzzy floating point comparison if one of the
 number is float

---
 pixel_clusterizer/cluster_functions.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/pixel_clusterizer/cluster_functions.py b/pixel_clusterizer/cluster_functions.py
index ceefab5..1b97aba 100644
--- a/pixel_clusterizer/cluster_functions.py
+++ b/pixel_clusterizer/cluster_functions.py
@@ -1,5 +1,5 @@
 ''' Fast clustering functions that are compiled in time via numba '''
-
+import numpy as np
 from numba import njit
 
 
@@ -139,8 +139,8 @@ def _is_in_max_difference(value_1, value_2, max_difference):
     Circumvents numba bug #1653
     '''
     if value_1 <= value_2:
-        return value_2 - value_1 <= max_difference
-    return value_1 - value_2 <= max_difference
+        return (np.nextafter(value_2, value_1) - np.nextafter(value_1, value_2)) <= max_difference
+    return (np.nextafter(value_1, value_2) - np.nextafter(value_2, value_1)) <= max_difference
 
 
 # @njit()

From 18aa9886a954ea4de3874be92abbb405608f95cd Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 5 Dec 2018 13:35:34 +0100
Subject: [PATCH 05/28] ENH: only pass valid indices

---
 pixel_clusterizer/cluster_functions.py | 5 ++---
 1 file changed, 2 insertions(+), 3 deletions(-)

diff --git a/pixel_clusterizer/cluster_functions.py b/pixel_clusterizer/cluster_functions.py
index 1b97aba..e612b08 100644
--- a/pixel_clusterizer/cluster_functions.py
+++ b/pixel_clusterizer/cluster_functions.py
@@ -39,8 +39,7 @@ def _finish_cluster(hits, clusters, cluster_size, cluster_hit_indices, cluster_i
     total_weighted_column = 0
     total_weighted_row = 0
 
-    for i in range(cluster_size):
-        hit_index = cluster_hit_indices[i]
+    for hit_index in cluster_hit_indices:
         if hits[hit_index]['charge'] > max_cluster_charge:
             seed_hit_index = hit_index
             max_cluster_charge = hits[hit_index]['charge']
@@ -264,7 +263,7 @@ def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, colum
                 hits=hits,
                 clusters=clusters,
                 cluster_size=cluster_size,
-                cluster_hit_indices=cluster_hit_indices,
+                cluster_hit_indices=cluster_hit_indices[:cluster_size],
                 cluster_index=start_event_cluster_index + event_cluster_index,
                 cluster_id=event_cluster_index,
                 charge_correction=charge_correction,

From 1e0ddfefab75b9fa7d035311fbb15e3a883df803 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 5 Dec 2018 13:35:50 +0100
Subject: [PATCH 06/28] MAINT: comments

---
 pixel_clusterizer/clusterizer.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 8bec2dc..bffab58 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -316,8 +316,8 @@ def cluster_hits(self, hits, noisy_pixels=None, disabled_pixels=None):
         if (n_hits < int(0.5 * self._cluster_hits.size)) or (n_hits > self._cluster_hits.size):
             self._init_arrays(size=int(1.1 * n_hits))  # oversize buffer slightly to reduce allocations
         else:
-            self._assigned_hit_array.fill(0)  # The hit indices of the actual cluster, 0 means not assigned
-            self._cluster_hit_indices.fill(-1)  # The hit indices of the actual cluster, -1 means not assigned
+            self._assigned_hit_array.fill(0)  # The array represents the assignment of hits to clusters, 0 means not assigned to any cluster
+            self._cluster_hit_indices.fill(-1)  # The hit indices of the actual cluster, -1 means not assigned to any hit
 
         self._clusters.dtype.names = self._unmap_cluster_field_names(self._clusters.dtype.names)  # Reset the data fields from previous renaming
         self._cluster_hits.dtype.names = self._unmap_hit_field_names(self._cluster_hits.dtype.names)  # Reset the data fields from previous renaming

From e0b688d4c4670e14c9eba351cffa933de43600f4 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 5 Dec 2018 13:50:26 +0100
Subject: [PATCH 07/28] MAINT: cleanup

---
 pixel_clusterizer/cluster_functions.py | 2 +-
 pixel_clusterizer/clusterizer.py       | 3 +--
 2 files changed, 2 insertions(+), 3 deletions(-)

diff --git a/pixel_clusterizer/cluster_functions.py b/pixel_clusterizer/cluster_functions.py
index e612b08..94b74db 100644
--- a/pixel_clusterizer/cluster_functions.py
+++ b/pixel_clusterizer/cluster_functions.py
@@ -221,7 +221,7 @@ def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, colum
         assigned_hit_array[i] = 1
         cluster_size = 1  # actual cluster has one hit so far
 
-        for j in cluster_hit_indices:  # Loop over all hits of the actual cluster; cluster_hit_indices is updated within the loop if new hit are found
+        for j in cluster_hit_indices:  # Loop over all hits of the actual cluster; cluster_hit_indices is updated within the loop if new hits are found
             if j < 0:  # There are no more cluster hits found
                 break
 
diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index bffab58..70192b2 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -122,8 +122,7 @@ def _init_arrays(self, size=0):
             self._cluster_hits = np.zeros(shape=(size, ), dtype=np.dtype(self._cluster_hits_descr))
             self._clusters = np.zeros(shape=(size, ), dtype=np.dtype(self._cluster_descr))
             self._assigned_hit_array = np.zeros(shape=(size, ), dtype=np.bool)
-            self._cluster_hit_indices = np.empty(shape=(size, ), dtype=np_int_type_chooser(size))
-            self._cluster_hit_indices.fill(-1)
+            self._cluster_hit_indices = np.full(shape=(size, ), fill_value=-1, dtype=np_int_type_chooser(size))
 
     def reset(self):  # Resets the overwritten function hooks, otherwise they are stored as a module global and not reset on clusterizer initialization
         self._init_arrays(size=0)

From b30d900a96b0613be8eff375715f5c9357b2b6c0 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 5 Dec 2018 14:28:02 +0100
Subject: [PATCH 08/28] ENH: check for increasing event number

---
 pixel_clusterizer/clusterizer.py | 7 +++++++
 1 file changed, 7 insertions(+)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 70192b2..6d0c9fa 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -126,6 +126,7 @@ def _init_arrays(self, size=0):
 
     def reset(self):  # Resets the overwritten function hooks, otherwise they are stored as a module global and not reset on clusterizer initialization
         self._init_arrays(size=0)
+        self._last_event_number = None
 
         def end_of_cluster_function(hits, clusters, cluster_size, cluster_hit_indices, cluster_index, cluster_id, charge_correction, noisy_pixels, disabled_pixels, seed_hit_index):
             pass
@@ -356,6 +357,12 @@ def cluster_hits(self, hits, noisy_pixels=None, disabled_pixels=None):
 #         disabled_pixels = np.recarray(disabled_pixels_array.shape[0], dtype=mask_dtype)
 #         disabled_pixels[:] = [(item[0], item[1]) for item in disabled_pixels_array]
 
+        # Check if event number is increasing. Otherwise give a warning message.
+        if self._last_event_number is not None and self._cluster_hits.shape[0] != 0 and self._cluster_hits[0]["event_number"] == self._last_event_number:
+            logging.warning('Event number not increasing.')
+        if self._cluster_hits.shape[0] != 0:
+            self._last_event_number = self._cluster_hits[-1]["event_number"]
+
         n_clusters = self.cluster_functions._cluster_hits(  # Set n_clusters to new size
             hits=self._cluster_hits[:n_hits],
             clusters=self._clusters[:n_hits],

From 70d44920b4733e50d72d9405f1ae0fe79fdf05c7 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 5 Dec 2018 14:28:30 +0100
Subject: [PATCH 09/28] MAINT: docstring

---
 pixel_clusterizer/clusterizer.py | 13 ++++++++++---
 1 file changed, 10 insertions(+), 3 deletions(-)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 6d0c9fa..b8d5daa 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -302,9 +302,16 @@ def ignore_same_hits(self, value):
     def cluster_hits(self, hits, noisy_pixels=None, disabled_pixels=None):
         ''' Cluster given hit array.
 
-        The noisy_pixels and disabled_pixels parameters are iterables of column/row index pairs, e.g. [[column_1, row_1], [column_2, row_2], ...].
-        The noisy_pixels parameter allows for removing clusters that consist of a single noisy pixels. Clusters with 2 or more noisy pixels are not removed.
-        The disabled_pixels parameter allows for ignoring pixels.
+        Parameters
+        ----------
+        hits : numpy.recarray
+            Hit data that will be clustered. The hit data contains all information that is required for clustering.
+            The hit data must contain only complete events.
+        noisy_pixels : list of 2-tuples
+            List of 2-tuples of column and row indices of noisy pixels. No cluster will be built when it consists of a single noisy pixel.
+            Clusters with two or more noisy pixels are built.
+        disabled_pixels : list of 2-tuples
+            List of 2-tuples of column and row indices of pixles that will be masked. Masked pixels will not be used during clustering.
         '''
         # Jitting a second time to workaround different bahavior of the installation methods on different platforms (pip install vs. python setup.py).
         # In some circumstances, the Numba compiler can't compile functions that were pickled previously.

From 8edbc592e4e87ebe02cd0d839d871198cabbc9ca Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 5 Dec 2018 14:48:49 +0100
Subject: [PATCH 10/28] MAINT: remove deprecated error check

---
 pixel_clusterizer/cluster_functions.py | 3 ---
 1 file changed, 3 deletions(-)

diff --git a/pixel_clusterizer/cluster_functions.py b/pixel_clusterizer/cluster_functions.py
index 94b74db..c5427e8 100644
--- a/pixel_clusterizer/cluster_functions.py
+++ b/pixel_clusterizer/cluster_functions.py
@@ -163,7 +163,6 @@ def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, colum
     total_hits = hits.shape[0]
     if total_hits == 0:
         return 0  # total clusters
-    max_cluster_hits = cluster_hit_indices.shape[0]
 
     if total_hits != clusters.shape[0]:
         raise ValueError("hits and clusters must be the same size")
@@ -246,8 +245,6 @@ def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, colum
                 if _is_in_max_difference(hits[j]['column'], hits[k]['column'], column_cluster_distance) and _is_in_max_difference(hits[j]['row'], hits[k]['row'], row_cluster_distance) and _is_in_max_difference(hits[j]['frame'], hits[k]['frame'], frame_cluster_distance):
                     if not ignore_same_hits or hits[j]['column'] != hits[k]['column'] or hits[j]['row'] != hits[k]['row']:
                         cluster_size += 1
-                        if cluster_size > max_cluster_hits:
-                            raise IndexError('cluster_hit_indices is too small to contain all cluster hits')
                         cluster_hit_indices[cluster_size - 1] = k
                         assigned_hit_array[k] = 1
 

From 85acca2e9fafe4ad6f9d2ccbe1529095932b9130 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Wed, 21 Aug 2019 11:08:48 +0200
Subject: [PATCH 11/28] ENH: adding parameter to disable charge weighted
 clustering (default)

---
 pixel_clusterizer/cluster_functions.py | 47 +++++++++++++-------------
 pixel_clusterizer/clusterizer.py       | 46 +++++++++++++++++++------
 2 files changed, 60 insertions(+), 33 deletions(-)

diff --git a/pixel_clusterizer/cluster_functions.py b/pixel_clusterizer/cluster_functions.py
index c5427e8..90f67c2 100644
--- a/pixel_clusterizer/cluster_functions.py
+++ b/pixel_clusterizer/cluster_functions.py
@@ -30,24 +30,27 @@ def _pixel_masked(hit, array):
 
 
 @njit()
-def _finish_cluster(hits, clusters, cluster_size, cluster_hit_indices, cluster_index, cluster_id, charge_correction, noisy_pixels, disabled_pixels):
+def _finish_cluster(hits, clusters, cluster_size, cluster_hit_indices, cluster_index, cluster_id, charge_correction, charge_weighted_clustering, noisy_pixels, disabled_pixels):
     ''' Set hit and cluster information of the cluster (e.g. number of hits in the cluster (cluster_size), total cluster charge (charge), ...).
     '''
     cluster_charge = 0
-    max_cluster_charge = -1
-    # necessary for charge weighted hit position
-    total_weighted_column = 0
-    total_weighted_row = 0
+    seed_charge = -1
+    total_column = 0
+    total_row = 0
 
     for hit_index in cluster_hit_indices:
-        if hits[hit_index]['charge'] > max_cluster_charge:
+        if hits[hit_index]['charge'] > seed_charge:
             seed_hit_index = hit_index
-            max_cluster_charge = hits[hit_index]['charge']
+            seed_charge = hits[hit_index]['charge']
         hits[hit_index]['is_seed'] = 0
         hits[hit_index]['cluster_size'] = cluster_size
-        # include charge correction in sum
-        total_weighted_column += hits[hit_index]['column'] * (hits[hit_index]['charge'] + charge_correction)
-        total_weighted_row += hits[hit_index]['row'] * (hits[hit_index]['charge'] + charge_correction)
+        if charge_weighted_clustering:
+            # include charge correction in sum
+            total_column += hits[hit_index]['column'] * (hits[hit_index]['charge'] + charge_correction)
+            total_row += hits[hit_index]['row'] * (hits[hit_index]['charge'] + charge_correction)
+        else:
+            total_column += hits[hit_index]['column']
+            total_row += hits[hit_index]['row']
         cluster_charge += hits[hit_index]['charge']
         hits[hit_index]['cluster_ID'] = cluster_id
 
@@ -58,9 +61,13 @@ def _finish_cluster(hits, clusters, cluster_size, cluster_hit_indices, cluster_i
     clusters[cluster_index]["charge"] = cluster_charge
     clusters[cluster_index]['seed_column'] = hits[seed_hit_index]['column']
     clusters[cluster_index]['seed_row'] = hits[seed_hit_index]['row']
-    # correct total charge value and calculate mean column and row
-    clusters[cluster_index]['mean_column'] = float(total_weighted_column) / (cluster_charge + cluster_size * charge_correction)
-    clusters[cluster_index]['mean_row'] = float(total_weighted_row) / (cluster_charge + cluster_size * charge_correction)
+    if charge_weighted_clustering:
+        # correct total charge value and calculate mean column and row
+        clusters[cluster_index]['mean_column'] = float(total_column) / (cluster_charge + cluster_size * charge_correction)
+        clusters[cluster_index]['mean_row'] = float(total_row) / (cluster_charge + cluster_size * charge_correction)
+    else:
+        clusters[cluster_index]['mean_column'] = float(total_column) / cluster_size
+        clusters[cluster_index]['mean_row'] = float(total_row) / cluster_size
 
     # Call end of cluster function hook
     _end_of_cluster_function(
@@ -101,11 +108,11 @@ def _hit_ok(hit, min_hit_charge, max_hit_charge):
     ''' Check if given hit is withing the limits.
     '''
     # Omit hits with charge < min_hit_charge
-    if hit['charge'] < min_hit_charge:
+    if min_hit_charge is not None and hit['charge'] < min_hit_charge:
         return False
 
     # Omit hits with charge > max_hit_charge
-    if max_hit_charge != 0 and hit['charge'] > max_hit_charge:
+    if max_hit_charge is not None and hit['charge'] > max_hit_charge:
         return False
 
     return True
@@ -157,7 +164,7 @@ def _is_in_max_difference(value_1, value_2, max_difference):
 
 
 @njit()
-def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, column_cluster_distance, row_cluster_distance, frame_cluster_distance, min_hit_charge, max_hit_charge, ignore_same_hits, noisy_pixels, disabled_pixels):
+def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, min_hit_charge, max_hit_charge, charge_correction, charge_weighted_clustering, column_cluster_distance, row_cluster_distance, frame_cluster_distance, ignore_same_hits, noisy_pixels, disabled_pixels):
     ''' Main precompiled function that loopes over the hits and clusters them
     '''
     total_hits = hits.shape[0]
@@ -170,13 +177,6 @@ def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, colum
     if total_hits != assigned_hit_array.shape[0]:
         raise ValueError("hits and assigned_hit_array must be the same size")
 
-    # Correction for charge weighting
-    # Some chips have non-zero charge for a charge value of zero, charge needs to be corrected to calculate cluster center correctly
-    if min_hit_charge == 0:
-        charge_correction = 1
-    else:
-        charge_correction = 0
-
     # Temporary variables that are reset for each cluster or event
     start_event_hit_index = 0
     start_event_cluster_index = 0
@@ -264,6 +264,7 @@ def _cluster_hits(hits, clusters, assigned_hit_array, cluster_hit_indices, colum
                 cluster_index=start_event_cluster_index + event_cluster_index,
                 cluster_id=event_cluster_index,
                 charge_correction=charge_correction,
+                charge_weighted_clustering=charge_weighted_clustering,
                 noisy_pixels=noisy_pixels,
                 disabled_pixels=disabled_pixels)
             event_cluster_index += 1
diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index b8d5daa..48bc796 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -29,7 +29,7 @@ class HitClusterizer(object):
 
     ''' Clusterizer class providing an interface for the jitted functions and stores settings.'''
 
-    def __init__(self, hit_fields=None, hit_dtype=None, cluster_fields=None, cluster_dtype=None, pure_python=False, min_hit_charge=0, max_hit_charge=None, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=0, ignore_same_hits=True):
+    def __init__(self, hit_fields=None, hit_dtype=None, cluster_fields=None, cluster_dtype=None, pure_python=False, min_hit_charge=None, max_hit_charge=None, charge_correction=None, charge_weighted_clustering=False, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=0, ignore_same_hits=True):
         # Activate pute python mode by setting the evnironment variable NUMBA_DISABLE_JIT
         self.pure_python = pure_python
         if self.pure_python:
@@ -106,11 +106,12 @@ def __init__(self, hit_fields=None, hit_dtype=None, cluster_fields=None, cluster
         # Std. settings
         self.set_min_hit_charge(min_hit_charge)
         self.set_max_hit_charge(max_hit_charge)
+        self.set_charge_correction(charge_correction)
+        self.set_charge_weighted_clustering(charge_weighted_clustering)
         self.set_column_cluster_distance(column_cluster_distance)
         self.set_row_cluster_distance(row_cluster_distance)
         self.set_frame_cluster_distance(frame_cluster_distance)
         self.ignore_same_hits(ignore_same_hits)
-
         self.reset()
 
     @property
@@ -266,19 +267,42 @@ def set_end_of_event_function(self, function):
         self._end_of_event_function = function
 
     def set_min_hit_charge(self, value):
-        ''' Charge values below this value will effectively ignore the hit.
-        Value has influence on clustering charge weighting.
+        ''' Hits with charge values below this value will be ignored.
+        If None, all hits will be used.
         '''
         self._min_hit_charge = value
 
     def set_max_hit_charge(self, value):
-        ''' Charge values above this value will effectively ignore the hit.
-        Value of None or 0 will deactivate this feature.
+        ''' Hits with charge values above this value will be ignored.
+        If None, all hits will be used.
         '''
-        if value is None:
-            value = 0
         self._max_hit_charge = value
 
+    def set_charge_correction(self, value):
+        ''' Adding the given value to the hit charge.
+        If 0 or None, no offset will be added to the hit charge.
+        Note:
+        1. The charge correction is olny used when charge_weighted_clustering
+           is True.
+        2. Charge digitizers of some front-end chips start with a value of 0.
+           If the privded data contains hits with chage of 0, charge_correction must
+           be set to 1 in this case. Otherwise hits with a charge value of 0
+           will not contribute to the charge weighted clustering.
+        '''
+        if value is None:
+            self._charge_correction = 0
+        else:
+            self._charge_correction = value
+
+    def set_charge_weighted_clustering(self, value):
+        ''' If True, the charge value of the hits is used
+        to calculate center of gravity of a cluster.
+        For correct function, the parameter charge_correction must be set correctly.
+        If False, only the arithmetic mean of the hit positions is used
+        to calculate the center of a cluster.
+        '''
+        self._charge_weighted_clustering = bool(value)
+
     def set_column_cluster_distance(self, value):
         ''' Setting up max. column cluster distance.
         '''
@@ -375,11 +399,13 @@ def cluster_hits(self, hits, noisy_pixels=None, disabled_pixels=None):
             clusters=self._clusters[:n_hits],
             assigned_hit_array=self._assigned_hit_array[:n_hits],
             cluster_hit_indices=self._cluster_hit_indices[:n_hits],
+            min_hit_charge=self._min_hit_charge,
+            max_hit_charge=self._max_hit_charge,
+            charge_correction=self._charge_correction,
+            charge_weighted_clustering=self._charge_weighted_clustering,
             column_cluster_distance=self._column_cluster_distance,
             row_cluster_distance=self._row_cluster_distance,
             frame_cluster_distance=self._frame_cluster_distance,
-            min_hit_charge=self._min_hit_charge,
-            max_hit_charge=self._max_hit_charge,
             ignore_same_hits=self._ignore_same_hits,
             noisy_pixels=noisy_pixels,
             disabled_pixels=disabled_pixels)

From 5fa3f96e9975e2b912e3c35ede50be81e4e2d853 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Thu, 19 Sep 2019 13:32:01 +0200
Subject: [PATCH 12/28] MAINT: test Python 3.7, cleanup

---
 .travis.yml      | 16 +++++++++-------
 appveyor.yml     | 18 ++++++++----------
 requirements.txt |  5 ++---
 3 files changed, 19 insertions(+), 20 deletions(-)

diff --git a/.travis.yml b/.travis.yml
index a5473a8..f44bff8 100644
--- a/.travis.yml
+++ b/.travis.yml
@@ -1,27 +1,29 @@
 language: python
 python:
-- 2.7
-- 3.5
+  - 2.7
+  - 3.7
 
 sudo: false
 
 notifications:
   email:
   - pohl@physik.uni-bonn.de
+  - janssen@physik.uni-bonn.de
 
 install:
   - if [[ "$TRAVIS_PYTHON_VERSION" == "2.7" ]]; then
-      wget https://repo.continuum.io/miniconda/Miniconda-latest-Linux-x86_64.sh -O miniconda.sh;
+      wget https://repo.continuum.io/miniconda/Miniconda2-latest-Linux-x86_64.sh -O miniconda.sh;
     else
       wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh -O miniconda.sh;
     fi
-  - chmod +x miniconda.sh
-  - bash miniconda.sh -b -p $HOME/miniconda
+  - bash miniconda.sh -b -p "$HOME/miniconda"
   - export PATH="$HOME/miniconda/bin:$PATH"
-  - conda install --yes numpy numba future nose docutils
+  - conda update --yes conda
   - conda info -a
+  - conda install --yes numpy numba nose
   - pip install coverage coveralls
-  - python setup.py develop
+  - pip install -e .
+  - conda list
 
 script:
   - nosetests  # Run nosetests with jitted functions
diff --git a/appveyor.yml b/appveyor.yml
index c84a060..70051ea 100644
--- a/appveyor.yml
+++ b/appveyor.yml
@@ -8,23 +8,21 @@ environment:
     - PYTHON_VERSION: 2.7
       MINICONDA: C:\Miniconda-x64
       PYTHON_ARCH: "64"
-    - PYTHON_VERSION: 3.5
-      MINICONDA: C:\Miniconda35
+    - PYTHON_VERSION: 3.7
+      MINICONDA: C:\Miniconda37
       PYTHON_ARCH: "32"
-    - PYTHON_VERSION: 3.5
-      MINICONDA: C:\Miniconda35-x64
+    - PYTHON_VERSION: 3.7
+      MINICONDA: C:\Miniconda37-x64
       PYTHON_ARCH: "64"
 
-init:
-  - "ECHO %PYTHON_VERSION% %MINICONDA%"
-
 install:
   # Miniconda Python setup + external packages installation
-  - set PATH=%MINICONDA%;%MINICONDA%\\Scripts;%PATH%  # Miniconda is already installed on appveyor: https://github.com/appveyor/ci/issues/359
-  - conda install --yes numpy numba future nose docutils
+  - set PATH=%MINICONDA%;%MINICONDA%\Scripts;%MINICONDA%\Library\bin;%PATH%
+  - conda update --yes conda
   - conda info -a
+  - conda install --yes numpy numba nose
+  - pip install -e .
   - conda list
-  - python setup.py develop  # Install pixel_clusterizer
 
 test_script:
   - nosetests
diff --git a/requirements.txt b/requirements.txt
index 0e90eb0..aeeb696 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -1,3 +1,2 @@
-future  # Python 2/3 compatibility
-numpy  # fast c array data structures 
-numba>=0.24.0  # JIT for numpy
+numpy
+numba>=0.24.0

From 38a6ba16f3db1cc8a38a851dde8a32cf7192586c Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Thu, 19 Sep 2019 13:58:14 +0200
Subject: [PATCH 13/28] MAINT: fixing tests, use proper parameters

---
 pixel_clusterizer/testing/test_clusterizer.py |  8 ++--
 pixel_clusterizer/testing/test_data_types.py  | 13 ++++---
 pixel_clusterizer/testing/test_hit_masking.py | 37 +++++++++----------
 3 files changed, 30 insertions(+), 28 deletions(-)

diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index 876a6ad..e852c96 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -68,7 +68,7 @@ def test_exceptions(self):
 
     def test_cluster_algorithm(self):  # Check with multiple jumps data
         # Inititalize Clusterizer
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
 
@@ -125,7 +125,7 @@ def test_cluster_cuts(self):
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
 
         # Create clusterizer object
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         # Case 1: Test max hit charge cut, accept all hits
         clusterizer.set_max_hit_charge(30)  # only add hits with charge <= 30
@@ -285,7 +285,7 @@ def test_cluster_cuts(self):
 
     def test_set_end_of_cluster_function(self):
         # Initialize clusterizer object
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
 
@@ -355,7 +355,7 @@ def end_of_cluster_function(hits, clusters, cluster_size, cluster_hit_indices, c
 
     def test_set_end_of_event_function(self):
         # Initialize clusterizer object
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
 
diff --git a/pixel_clusterizer/testing/test_data_types.py b/pixel_clusterizer/testing/test_data_types.py
index 9d7a2c6..ac98f6d 100644
--- a/pixel_clusterizer/testing/test_data_types.py
+++ b/pixel_clusterizer/testing/test_data_types.py
@@ -52,7 +52,7 @@ def test_different_hit_data_types(self):
                                ('parameter_2', 'f4')])
 
         # Initialize clusterizer
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         for hit_data_type in hit_data_types:
             clusterizer.set_hit_dtype(np.dtype(hit_data_type))
@@ -172,7 +172,10 @@ def test_different_cluster_data_types(self):
 
         # Initialize clusterizer
         clusterizer = HitClusterizer(pure_python=self.pure_python,
-                                     min_hit_charge=0, max_hit_charge=13,
+                                     min_hit_charge=0,
+                                     max_hit_charge=13,
+                                     charge_correction=1,
+                                     charge_weighted_clustering=True,
                                      column_cluster_distance=2,
                                      row_cluster_distance=2,
                                      frame_cluster_distance=4,
@@ -292,7 +295,7 @@ def test_custom_hit_fields(self):
                       }
 
         # Initialize clusterizer and cluster test hits with self defined data type names
-        clusterizer = HitClusterizer(hit_fields=hit_fields, hit_dtype=hit_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(hit_fields=hit_fields, hit_dtype=hit_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2, hit_dtype=hit_dtype, hit_fields=hit_fields)
         cluster_hits, clusters = clusterizer.cluster_hits(hits)
         array_size_before = clusterizer._clusters.shape[0]
@@ -399,7 +402,7 @@ def test_custom_cluster_fields(self):
                           }
 
         # Initialize clusterizer and cluster test hits with self defined data type names
-        clusterizer = HitClusterizer(cluster_fields=cluster_fields, cluster_dtype=cluster_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(cluster_fields=cluster_fields, cluster_dtype=cluster_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
         cluster_hits, clusters = clusterizer.cluster_hits(hits)
         array_size_before = clusterizer._clusters.shape[0]
@@ -487,7 +490,7 @@ def test_custom_cluster_fields(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
     def test_adding_cluster_field(self):
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
         with self.assertRaises(TypeError):
             clusterizer.add_cluster_field(description=['extra_field', 'f4'])  # also test list of 2 items
         clusterizer.add_cluster_field(description=[('extra_field', 'f4')])  # also test list of 2-tuples
diff --git a/pixel_clusterizer/testing/test_hit_masking.py b/pixel_clusterizer/testing/test_hit_masking.py
index bb10a74..27795c8 100644
--- a/pixel_clusterizer/testing/test_hit_masking.py
+++ b/pixel_clusterizer/testing/test_hit_masking.py
@@ -33,7 +33,6 @@ class TestClusterizer(unittest.TestCase):
     def setUpClass(cls):
         cls.pure_python = os.getenv('PURE_PYTHON', False)
 
-
     def test_disabled_pixels(self):
         # Create some fake data
         hits = np.ones(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
@@ -50,7 +49,7 @@ def test_disabled_pixels(self):
         hits[6]['column'], hits[6]['row'], hits[6]['charge'], hits[6]['event_number'], hits[6]['frame'] = 3, 3, 7, 3, 11
 
         # Create clusterizer object
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         # Case 1: Test max hit charge cut, accept all hits
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[2, 2], [3, 3]])  # cluster hits
@@ -114,7 +113,7 @@ def test_noisy_pixels(self):
         hits[8]['column'], hits[8]['row'], hits[8]['charge'], hits[8]['event_number'], hits[8]['frame'] = 20, 15, 1, 5, 0
 
         # Create clusterizer object
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         # Case 1: Test max hit charge cut, accept all hits
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[2, 2], [3, 3], [3, 15]])  # cluster hits
@@ -170,7 +169,7 @@ def test_noisy_and_disabled_pixels(self):
         hits[0]['column'], hits[0]['row'] = 1, 1
 
         # Case 1: Test single noisy pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 1]])
 
         expected_cluster_result = np.zeros(shape=(0, ), dtype=np.dtype([('event_number', '<i8'),
@@ -206,7 +205,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 2: Test single disabled pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 1]])
 
         # Test results
@@ -223,7 +222,7 @@ def test_noisy_and_disabled_pixels(self):
         hits[1]['column'], hits[1]['row'] = 1, 2
 
         # Case 3: Test double noisy pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 1], [1, 2]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
@@ -267,7 +266,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 4: Test double noisy pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 1], [1, 2]])
 
         expected_cluster_result = np.zeros(shape=(0, ), dtype=np.dtype([('event_number', '<i8'),
@@ -303,7 +302,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 5: Test noisy and disabled pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 1]], disabled_pixels=[[1, 2]])
 
         # Test results
@@ -321,7 +320,7 @@ def test_noisy_and_disabled_pixels(self):
         hits[2]['column'], hits[2]['row'] = 1, 3
 
         # Case 6: Test triple pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 1]], noisy_pixels=[[1, 2], [1, 3]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
@@ -376,7 +375,7 @@ def test_noisy_and_disabled_pixels(self):
         hits[3]['column'], hits[3]['row'] = 1, 4
 
         # Case 7: Test quadruple pixel with single disabled pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3]])
 
         expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
@@ -420,7 +419,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 8: Test quadruple pixel with single noisy pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
@@ -476,7 +475,7 @@ def test_noisy_and_disabled_pixels(self):
         hits[4]['column'], hits[4]['row'] = 1, 5
 
         # Case 9: Test quintuple pixel with 2 disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3], [1, 4]])
 
         expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
@@ -520,7 +519,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 10: Test quintuple pixel with 2 noisy pixel
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
@@ -564,7 +563,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 11: Test quintuple pixel with single noisy and disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]], disabled_pixels=[[1, 4]])
 
         expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
@@ -608,7 +607,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 12: Test quintuple pixel with single noisy and disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]], disabled_pixels=[[1, 4]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
@@ -665,7 +664,7 @@ def test_noisy_and_disabled_pixels(self):
         hits[5]['column'], hits[5]['row'] = 1, 6
 
         # Case 13: Test sextuple pixel with noisy and disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3], [1, 5]], disabled_pixels=[[1, 4]])
 
         expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
@@ -709,7 +708,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 14: Test sextuple pixel with noisy and disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3], [1, 5]], disabled_pixels=[[1, 4]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
@@ -753,7 +752,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 15: Test sextuple pixel with noisy and disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3], [1, 5]], noisy_pixels=[[1, 4]])
 
         expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
@@ -797,7 +796,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Case 16: Test sextuple pixel with noisy and disabled pixels
-        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3], [1, 5]], noisy_pixels=[[1, 4]])
 
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),

From d2d8496a08dfe7c6644ff17f7482271efdb6aed6 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Thu, 19 Sep 2019 14:05:51 +0200
Subject: [PATCH 14/28] MAINT: update README, fix appveyor badge

---
 README.md | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/README.md b/README.md
index 2ab90f1..bee38c7 100644
--- a/README.md
+++ b/README.md
@@ -1,7 +1,7 @@
-# Pixel Clusterizer [![Build Status](https://travis-ci.org/SiLab-Bonn/pixel_clusterizer.svg?branch=master)](https://travis-ci.org/SiLab-Bonn/pixel_clusterizer) [![Build Status](https://ci.appveyor.com/api/projects/status/github/SiLab-Bonn/pixel_clusterizer)](https://ci.appveyor.com/project/SiLab-Bonn/pixel_clusterizer) [![Coverage Status](https://coveralls.io/repos/github/SiLab-Bonn/pixel_clusterizer/badge.svg?branch=master)](https://coveralls.io/github/SiLab-Bonn/pixel_clusterizer?branch=master)
+# Pixel Clusterizer [![Build Status](https://travis-ci.org/SiLab-Bonn/pixel_clusterizer.svg?branch=master)](https://travis-ci.org/SiLab-Bonn/pixel_clusterizer) [![Build status](https://ci.appveyor.com/api/projects/status/c8jqu9ow696opevf?svg=true)](https://ci.appveyor.com/project/laborleben/pixel-clusterizer) [![Coverage Status](https://coveralls.io/repos/github/SiLab-Bonn/pixel_clusterizer/badge.svg?branch=master)](https://coveralls.io/github/SiLab-Bonn/pixel_clusterizer?branch=master)
+
+Pixel_clusterizer is an easy to use pixel hit clusterizer for Python. It clusters hits connected to unique event numbers in space and time.
 
-Pixel_clusterizer is an easy to use pixel hit-clusterizer for Python. It clusters hits on an event basis in space and time.
- 
 The hits have to be defined as a numpy recarray. The array has to have the following fields:
 - event_number
 - frame

From ab24a24ec343ae70e773525236276d0b0e29f840 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Mon, 23 Sep 2019 12:00:37 +0200
Subject: [PATCH 15/28] MAINT: adding more tests for charge offset and charge
 weighted clustering parameters

---
 README.md                                     |   2 -
 pixel_clusterizer/testing/test_clusterizer.py | 197 +++++++++++++++++-
 2 files changed, 192 insertions(+), 7 deletions(-)

diff --git a/README.md b/README.md
index bee38c7..e019458 100644
--- a/README.md
+++ b/README.md
@@ -27,8 +27,6 @@ A new array with cluster information is also created created and has the followi
 - mean_column
 - mean_row
 
-
-
 # Installation
 
 The stable code is hosted on PyPI and can be installed by typing:
diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index e852c96..eac77f8 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -66,8 +66,195 @@ def test_exceptions(self):
         clusterizer = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype_new, pure_python=self.pure_python)
         _, _ = clusterizer.cluster_hits(np.array([], dtype=hit_dtype_new))
 
-    def test_cluster_algorithm(self):  # Check with multiple jumps data
-        # Inititalize Clusterizer
+    def test_cluster_algorithm(self):  # Basic functionality checks
+        # Initialize Clusterizer with default arguments
+        clusterizer = HitClusterizer(pure_python=self.pure_python)
+
+        hits = create_hits(n_hits=15, max_column=100, max_row=100, max_frame=1, max_charge=2)
+        # Dioganal
+        hits[1]["row"] = 2
+        hits[2]["column"] = 4
+        hits[2]["row"] = 4
+        # Same row
+        hits[4]["row"] = 7
+        hits[5]["column"] = 7
+        hits[5]["row"] = 7
+        # Same column
+        hits[7]["column"] = 7
+        hits[7]["row"] = 14
+        hits[8]["column"] = 7
+        hits[8]["row"] = 16
+        # Test frame
+        hits[10]["row"] = 20
+        hits[10]["frame"] = 1
+        # Same location
+        hits[14]["column"] = 13
+        hits[14]["row"] = 25
+
+        cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
+
+        # Define expected output
+        expected_cluster_result = np.zeros(shape=(11, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('ID', '<u2'),
+            ('n_hits', '<u2'),
+            ('charge', 'f4'),
+            ('seed_column', '<u2'),
+            ('seed_row', '<u2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')]))
+        expected_cluster_result['event_number'] = [0, 0, 1, 1, 2, 2, 3, 3, 3, 4, 4]
+        expected_cluster_result['ID'] = [0, 1, 0, 1, 0, 1, 0, 1, 2, 0, 1]
+        expected_cluster_result['n_hits'] = [2, 1, 2, 1, 2, 1, 1, 1, 1, 1, 1]
+        expected_cluster_result['charge'] = [1.0, 0.0, 1.0, 1.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0]
+        expected_cluster_result['seed_column'] = [2, 4, 4, 7, 7, 7, 10, 11, 12, 13, 14]
+        expected_cluster_result['seed_row'] = [2, 4, 7, 7, 14, 16, 19, 20, 23, 25, 27]
+        expected_cluster_result['mean_column'] = [1.5, 4.0, 4.5, 7.0, 7.0, 7.0, 10.0, 11.0, 12.0, 13.0, 14.0]
+        expected_cluster_result['mean_row'] = [1.5, 4.0, 7.0, 7.0, 13.5, 16.0, 19.0, 20.0, 23.0, 25.0, 27.0]
+
+        # Define expected output
+        expected_hit_result = np.zeros(shape=(15, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('frame', '<u1'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<u2'),
+            ('cluster_ID', '<i2'),
+            ('is_seed', '<u1'),
+            ('cluster_size', '<u2'),
+            ('n_cluster', '<u2')]))
+        expected_hit_result['event_number'] = hits['event_number']
+        expected_hit_result['frame'] = hits['frame']
+        expected_hit_result['column'] = hits['column']
+        expected_hit_result['row'] = hits['row']
+        expected_hit_result['charge'] = hits['charge']
+        expected_hit_result['cluster_ID'] = [0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 2, 0, 1, -2]
+        expected_hit_result['is_seed'] = [0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0]
+        expected_hit_result['cluster_size'] = [2, 2, 1, 2, 2, 1, 2, 2, 1, 1, 1, 1, 1, 1, 0]
+        expected_hit_result['n_cluster'] = [2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 2, 2, 2]
+
+        # Test results
+        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
+        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+
+        # Initialize Clusterizer and test charge weighted clustering
+        clusterizer = HitClusterizer(pure_python=self.pure_python, charge_weighted_clustering=True)
+
+        # Create some fake data
+        hits = np.ones(shape=(4, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('frame', '<u1'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<u2')]))
+        hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
+        hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
+        hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
+        hits[3]['column'], hits[3]['row'], hits[3]['charge'], hits[3]['event_number'] = 18, 37, 10, 20
+
+        cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
+
+        # Define expected output
+        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('ID', '<u2'),
+            ('n_hits', '<u2'),
+            ('charge', 'f4'),
+            ('seed_column', '<u2'),
+            ('seed_row', '<u2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')]))
+        expected_cluster_result['event_number'] = [19, 20]
+        expected_cluster_result['n_hits'] = [2, 2]
+        expected_cluster_result['charge'] = [10.0, 11.0]
+        expected_cluster_result['seed_column'] = [18, 18]
+        expected_cluster_result['seed_row'] = [37, 37]
+        expected_cluster_result['mean_column'] = [18.0, (1.0 * 17 + 10.0 * 18) / 11.0]
+        expected_cluster_result['mean_row'] = [37.0, (1.0 * 36 + 10.0 * 37) / 11.0]
+
+        # Define expected output
+        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('frame', '<u1'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<u2'),
+            ('cluster_ID', '<i2'),
+            ('is_seed', '<u1'),
+            ('cluster_size', '<u2'),
+            ('n_cluster', '<u2')]))
+        expected_hit_result['event_number'] = hits['event_number']
+        expected_hit_result['frame'] = hits['frame']
+        expected_hit_result['column'] = hits['column']
+        expected_hit_result['row'] = hits['row']
+        expected_hit_result['charge'] = hits['charge']
+        expected_hit_result['is_seed'] = [0, 1, 0, 1]
+        expected_hit_result['cluster_size'] = [2, 2, 2, 2]
+        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+
+        # Test results
+        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
+        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+
+        # Initialize Clusterizer and test charge weighted clustering and charge correction
+        clusterizer = HitClusterizer(pure_python=self.pure_python, charge_correction=1, charge_weighted_clustering=True)
+
+        # Create some fake data
+        hits = np.ones(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
+                                                    ('frame', '<u1'),
+                                                    ('column', '<u2'),
+                                                    ('row', '<u2'),
+                                                    ('charge', '<u2')]))
+        hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
+        hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
+        hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
+        hits[3]['column'], hits[3]['row'], hits[3]['charge'], hits[3]['event_number'] = 18, 37, 10, 20
+
+        cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
+
+        # Define expected output
+        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('ID', '<u2'),
+            ('n_hits', '<u2'),
+            ('charge', 'f4'),
+            ('seed_column', '<u2'),
+            ('seed_row', '<u2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')]))
+        expected_cluster_result['event_number'] = [19, 20]
+        expected_cluster_result['n_hits'] = [2, 2]
+        expected_cluster_result['charge'] = [10.0, 11.0]
+        expected_cluster_result['seed_column'] = [18, 18]
+        expected_cluster_result['seed_row'] = [37, 37]
+        expected_cluster_result['mean_column'] = [(1.0 * 17 + 11.0 * 18) / 12.0, (2.0 * 17 + 11.0 * 18) / 13.0]
+        expected_cluster_result['mean_row'] = [(1.0 * 36 + 11.0 * 37) / 12.0, (2.0 * 36 + 11.0 * 37) / 13.0]
+
+        # Define expected output
+        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('frame', '<u1'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<u2'),
+            ('cluster_ID', '<i2'),
+            ('is_seed', '<u1'),
+            ('cluster_size', '<u2'),
+            ('n_cluster', '<u2')]))
+        expected_hit_result['event_number'] = hits['event_number']
+        expected_hit_result['frame'] = hits['frame']
+        expected_hit_result['column'] = hits['column']
+        expected_hit_result['row'] = hits['row']
+        expected_hit_result['charge'] = hits['charge']
+        expected_hit_result['is_seed'] = [0, 1, 0, 1]
+        expected_hit_result['cluster_size'] = [2, 2, 2, 2]
+        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+
+        # Test results
+        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
+        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+
+        # Initialize Clusterizer
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
 
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -171,7 +358,7 @@ def test_cluster_cuts(self):
         self.assertTrue(np.array_equal(clusters, expected_cluster_result))
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
-        # Case 2: Test max hit charge cut, omit charge > 29 hits
+        # Case 2: Test max hit charge cut, omit hits with charge > 29
         hits['event_number'] = 20
         clusterizer.set_max_hit_charge(29)  # only add hits with charge <= 30
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
@@ -261,14 +448,14 @@ def test_cluster_cuts(self):
         expected_cluster_result['mean_column'] = [18.0]
         expected_cluster_result['mean_row'] = [37.0]
 
-        clusterizer.ignore_same_hits(True)  # If a hit occured 2 times in an event it is ignored and gets the cluster index -2
+        clusterizer.ignore_same_hits(True)  # If a hit occurred 2 times in an event it is ignored and gets the cluster index -2
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # Cluster hits
 
         # Test results
         self.assertTrue(np.array_equal(clusters, expected_cluster_result))
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
-        clusterizer.ignore_same_hits(False)  # If a hit occured 2 times in an event it is used as a normal hit
+        clusterizer.ignore_same_hits(False)  # If a hit occurred 2 times in an event it is used as a normal hit
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # Cluster hits
 
         expected_hit_result['cluster_ID'] = [0, 0, 0]

From a6df150882092bf5d28ea1a06d207d1acee64bc3 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Mon, 23 Sep 2019 13:54:04 +0200
Subject: [PATCH 16/28] MAINT: update README

---
 README.md | 87 +++++++++++++++++++++++++++++++++----------------------
 1 file changed, 53 insertions(+), 34 deletions(-)

diff --git a/README.md b/README.md
index e019458..f0e247f 100644
--- a/README.md
+++ b/README.md
@@ -1,39 +1,63 @@
 # Pixel Clusterizer [![Build Status](https://travis-ci.org/SiLab-Bonn/pixel_clusterizer.svg?branch=master)](https://travis-ci.org/SiLab-Bonn/pixel_clusterizer) [![Build status](https://ci.appveyor.com/api/projects/status/c8jqu9ow696opevf?svg=true)](https://ci.appveyor.com/project/laborleben/pixel-clusterizer) [![Coverage Status](https://coveralls.io/repos/github/SiLab-Bonn/pixel_clusterizer/badge.svg?branch=master)](https://coveralls.io/github/SiLab-Bonn/pixel_clusterizer?branch=master)
 
+## Intended Use
+
 Pixel_clusterizer is an easy to use pixel hit clusterizer for Python. It clusters hits connected to unique event numbers in space and time.
 
-The hits have to be defined as a numpy recarray. The array has to have the following fields:
-- event_number
-- frame
-- column
-- row
-- charge
-
-or a mapping of the names has to be provided. The data type does not matter.
-
-The result of the clustering is the hit array extended by the following fields:
-- cluster_ID
-- is_seed
-- cluster_size
-- n_cluster
-
-A new array with cluster information is also created created and has the following fields:
-- event_number
-- ID
-- size
-- charge
-- seed_column
-- seed_row
-- mean_column
-- mean_row
-
-# Installation
+The hits must be provided in a numpy recarray. The array must contain the following columns ("fields"):
+- ```event_number```
+- ```frame```
+- ```column```
+- ```row```
+- ```charge```
+
+If the column names are different, a mapping of the names to the default names can be provided. The data type of each column can vary and is not fixed. The ```column```/```row``` values can be either indices (integer) or positions (float). ```Charge``` can be either integer or float.
+
+After clustering, two new arrays are returned:
+1. The cluster hits array is the hits array extended by the following columns:
+    - ```cluster_ID```
+    - ```is_seed```
+    - ```cluster_size```
+    - ```n_cluster```
+2. The cluster array contains in each row the information about a single cluster. It has the following columns:
+    - ```event_number```
+    - ```ID```
+    - ```n_hits```
+    - ```charge```
+    - ```seed_column```
+    - ```seed_row```
+    - ```mean_column```
+    - ```mean_row```
+
+## Installation
+
+Python 2.7 or Python 3 or higher must be used. There are many ways to install Python, though we recommend using [Anaconda Python](https://www.anaconda.com/distribution/) or [Miniconda](https://docs.conda.io/en/latest/miniconda.html).
+
+### Prerequisites
+
+The following packages are required:
+```
+numpy numba>=0.24.0
+```
 
-The stable code is hosted on PyPI and can be installed by typing:
+### Installation of pixel_clusterizer
 
+The stable code is hosted on PyPI and can be installed by typing:
+```
 pip install pixel_clusterizer
+```
+
+For developer, clone the pixel_clusterizer git repository and use the following command to install pixel_clusterizer:
+```
+pip install -e .
+```
+
+For testing the basic functionality of pixel_clusterizer, execute the following command:
+```
+nosetests pixel_clusterizer
+```
 
-# Usage
+## Usage
 
 ```
 import numpy as np
@@ -47,9 +71,4 @@ cr = clusterizer.HitClusterizer()  # Initialize clusterizer
 hits_clustered, cluster = cr.cluster_hits(hits)  # Cluster hits
 
 ```
-Also take a look at the example folder!
-
-# Test installation
-```
-nosetests pixel_clusterizer
-```
+Also please have a look at the ```examples``` folder!

From ecc9584581cca27f18acfb4ee995336adbb1e40a Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 10:12:19 +0200
Subject: [PATCH 17/28] ENH: allow safe casting

---
 pixel_clusterizer/clusterizer.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 48bc796..7cf9875 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -470,7 +470,7 @@ def _check_struct_compatibility(self, hits):
                 continue
             if key not in hits.dtype.names:
                 raise TypeError('Required hit field "%s" not found.' % key)
-            if self._cluster_hits.dtype[mapped_key] != hits.dtype[key]:
+            if self._cluster_hits.dtype[mapped_key] != hits.dtype[key] and not np.can_cast(hits.dtype[key], self._cluster_hits.dtype[mapped_key]):
                 raise TypeError('The dtype for hit data field "%s" does not match. Got/expected: %s/%s.' % (key, hits.dtype[key], self._cluster_hits.dtype[mapped_key]))
         additional_hit_fields = set(hits.dtype.names) - set([key for key, val in self._cluster_hits_descr])
         if additional_hit_fields:

From 8f3293ae23dfe99338133149f0d673c7a7257ff7 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 10:56:30 +0200
Subject: [PATCH 18/28] MAINT: use default hit dtype

---
 README.md                                     |  2 +-
 pixel_clusterizer/clusterizer.py              | 11 ++++++-----
 pixel_clusterizer/testing/test_clusterizer.py |  8 ++------
 pixel_clusterizer/testing/test_data_types.py  |  8 ++------
 pixel_clusterizer/testing/test_hit_masking.py |  8 ++------
 5 files changed, 13 insertions(+), 24 deletions(-)

diff --git a/README.md b/README.md
index f0e247f..c570b27 100644
--- a/README.md
+++ b/README.md
@@ -64,7 +64,7 @@ import numpy as np
 
 from pixel_clusterizer import clusterizer
 
-hits = np.ones(shape=(3, ), dtype=clusterizer.hit_data_type)  # Create some data with std. hit data type
+hits = np.ones(shape=(3, ), dtype=clusterizer.default_hit_data_type)  # Create some data with std. hit data type
 
 cr = clusterizer.HitClusterizer()  # Initialize clusterizer
 
diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 7cf9875..a9ac55e 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -4,11 +4,12 @@
 import numpy as np
 
 
-hit_data_type = np.dtype([('event_number', '<i8'),
-                          ('frame', '<u1'),
-                          ('column', '<u2'),
-                          ('row', '<u2'),
-                          ('charge', '<u2')])
+default_hit_data_type = np.dtype([
+    ('event_number', '<i8'),
+    ('frame', '<u1'),
+    ('column', '<u2'),
+    ('row', '<u2'),
+    ('charge', '<u2')])
 
 
 def np_uint_type_chooser(number):
diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index eac77f8..95167a7 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -6,14 +6,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_data_type
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=np.dtype([('event_number', '<i8'),
-                                                                                        ('frame', '<u1'),
-                                                                                        ('column', '<u2'),
-                                                                                        ('row', '<u2'),
-                                                                                        ('charge', '<u2')]), hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_data_type, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
diff --git a/pixel_clusterizer/testing/test_data_types.py b/pixel_clusterizer/testing/test_data_types.py
index ac98f6d..e1529f2 100644
--- a/pixel_clusterizer/testing/test_data_types.py
+++ b/pixel_clusterizer/testing/test_data_types.py
@@ -6,14 +6,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_data_type
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=np.dtype([('event_number', '<i8'),
-                                                                                        ('frame', '<u1'),
-                                                                                        ('column', '<u2'),
-                                                                                        ('row', '<u2'),
-                                                                                        ('charge', '<u2')]), hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_data_type, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
diff --git a/pixel_clusterizer/testing/test_hit_masking.py b/pixel_clusterizer/testing/test_hit_masking.py
index 27795c8..d92c258 100644
--- a/pixel_clusterizer/testing/test_hit_masking.py
+++ b/pixel_clusterizer/testing/test_hit_masking.py
@@ -8,14 +8,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_data_type
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=np.dtype([('event_number', '<i8'),
-                                                                                        ('frame', '<u1'),
-                                                                                        ('column', '<u2'),
-                                                                                        ('row', '<u2'),
-                                                                                        ('charge', '<u2')]), hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_data_type, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):

From 3119c917a7fd72fba2ef84f3423b91c26afc90ec Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 10:59:34 +0200
Subject: [PATCH 19/28] ENH: raise exception for dtype float16 which is not
 supported by numba

---
 pixel_clusterizer/clusterizer.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index a9ac55e..1b6c472 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -471,6 +471,8 @@ def _check_struct_compatibility(self, hits):
                 continue
             if key not in hits.dtype.names:
                 raise TypeError('Required hit field "%s" not found.' % key)
+            if not self.pure_python and hits.dtype[key] == np.float16:
+                raise TypeError('The dtype float16 for hit data filed "%s" is not supported.' % (key,))
             if self._cluster_hits.dtype[mapped_key] != hits.dtype[key] and not np.can_cast(hits.dtype[key], self._cluster_hits.dtype[mapped_key]):
                 raise TypeError('The dtype for hit data field "%s" does not match. Got/expected: %s/%s.' % (key, hits.dtype[key], self._cluster_hits.dtype[mapped_key]))
         additional_hit_fields = set(hits.dtype.names) - set([key for key, val in self._cluster_hits_descr])

From 4c1b0f33e25a5ebb036998fa39dc5fc76cfd6208 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 11:18:51 +0200
Subject: [PATCH 20/28] MAINT: update README

---
 README.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/README.md b/README.md
index c570b27..34620d6 100644
--- a/README.md
+++ b/README.md
@@ -68,7 +68,7 @@ hits = np.ones(shape=(3, ), dtype=clusterizer.default_hit_data_type)  # Create s
 
 cr = clusterizer.HitClusterizer()  # Initialize clusterizer
 
-hits_clustered, cluster = cr.cluster_hits(hits)  # Cluster hits
+cluster_hits, clusters = cr.cluster_hits(hits)  # Cluster hits
 
 ```
 Also please have a look at the ```examples``` folder!

From 9e9182b87c87cba1c2619070af2d7df423424d4c Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 11:21:39 +0200
Subject: [PATCH 21/28] MAINT: code cleanup

---
 pixel_clusterizer/testing/test_clusterizer.py | 25 ++--------
 pixel_clusterizer/testing/test_hit_masking.py | 48 ++++---------------
 2 files changed, 12 insertions(+), 61 deletions(-)

diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index 95167a7..9be0627 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -137,12 +137,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('frame', '<u1'),
-            ('column', '<u2'),
-            ('row', '<u2'),
-            ('charge', '<u2')]))
+        hits = np.ones(shape=(4, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
@@ -196,11 +191,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_correction=1, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                    ('frame', '<u1'),
-                                                    ('column', '<u2'),
-                                                    ('row', '<u2'),
-                                                    ('charge', '<u2')]))
+        hits = np.ones(shape=(4, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
@@ -299,11 +290,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
 
     def test_cluster_cuts(self):
         # Create some fake data
-        hits = np.ones(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                    ('frame', '<u1'),
-                                                    ('column', '<u2'),
-                                                    ('row', '<u2'),
-                                                    ('charge', '<u2')]))
+        hits = np.ones(shape=(2, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 30, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
 
@@ -401,11 +388,7 @@ def test_cluster_cuts(self):
 
         # Case 3: Add the same hit within an event
         # Create some fake data
-        hits = np.ones(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                    ('frame', '<u1'),
-                                                    ('column', '<u2'),
-                                                    ('row', '<u2'),
-                                                    ('charge', '<u2')]))
+        hits = np.ones(shape=(3, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 18, 36, 6, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 18, 38, 6, 19
diff --git a/pixel_clusterizer/testing/test_hit_masking.py b/pixel_clusterizer/testing/test_hit_masking.py
index d92c258..352a0cc 100644
--- a/pixel_clusterizer/testing/test_hit_masking.py
+++ b/pixel_clusterizer/testing/test_hit_masking.py
@@ -31,11 +31,7 @@ def setUpClass(cls):
 
     def test_disabled_pixels(self):
         # Create some fake data
-        hits = np.ones(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
-                                                    ('frame', '<u1'),
-                                                    ('column', '<u2'),
-                                                    ('row', '<u2'),
-                                                    ('charge', '<u2')]))
+        hits = np.ones(shape=(7, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'], hits[0]['frame'] = 1, 2, 4, 0, 0
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'], hits[1]['frame'] = 2, 2, 4, 0, 0
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'], hits[2]['frame'] = 2, 2, 5, 1, 10
@@ -93,11 +89,7 @@ def test_disabled_pixels(self):
 
     def test_noisy_pixels(self):
         # Create some fake data
-        hits = np.ones(shape=(9, ), dtype=np.dtype([('event_number', '<i8'),
-                                                    ('frame', '<u1'),
-                                                    ('column', '<u2'),
-                                                    ('row', '<u2'),
-                                                    ('charge', '<u2')]))
+        hits = np.ones(shape=(9, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'], hits[0]['frame'] = 1, 2, 8, 0, 0
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'], hits[1]['frame'] = 2, 2, 4, 0, 0
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'], hits[2]['frame'] = 2, 2, 5, 1, 10
@@ -157,11 +149,7 @@ def test_noisy_pixels(self):
 
     def test_noisy_and_disabled_pixels(self):
         # Create single hit data
-        hits = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                     ('frame', '<u1'),
-                                                     ('column', '<u2'),
-                                                     ('row', '<u2'),
-                                                     ('charge', '<u2')]))
+        hits = np.zeros(shape=(1, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'] = 1, 1
 
         # Case 1: Test single noisy pixel
@@ -209,11 +197,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create double hit data
-        hits = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                     ('frame', '<u1'),
-                                                     ('column', '<u2'),
-                                                     ('row', '<u2'),
-                                                     ('charge', '<u2')]))
+        hits = np.zeros(shape=(2, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
 
@@ -306,11 +290,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create triple hit data
-        hits = np.zeros(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                     ('frame', '<u1'),
-                                                     ('column', '<u2'),
-                                                     ('row', '<u2'),
-                                                     ('charge', '<u2')]))
+        hits = np.zeros(shape=(3, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -360,11 +340,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create quadruple hit data
-        hits = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                     ('frame', '<u1'),
-                                                     ('column', '<u2'),
-                                                     ('row', '<u2'),
-                                                     ('charge', '<u2')]))
+        hits = np.zeros(shape=(4, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -459,11 +435,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create quintuple hit data
-        hits = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                     ('frame', '<u1'),
-                                                     ('column', '<u2'),
-                                                     ('row', '<u2'),
-                                                     ('charge', '<u2')]))
+        hits = np.zeros(shape=(5, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -647,11 +619,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create sextuple hit data
-        hits = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                     ('frame', '<u1'),
-                                                     ('column', '<u2'),
-                                                     ('row', '<u2'),
-                                                     ('charge', '<u2')]))
+        hits = np.zeros(shape=(6, ), dtype=default_hit_data_type)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3

From 9e6ed3f93f9008687912bf544ea9845aa09edbb6 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 11:45:16 +0200
Subject: [PATCH 22/28] ENH: change default data type (frame -> u2, charge ->
 f4)

---
 README.md                                     |  4 +-
 pixel_clusterizer/clusterizer.py              | 81 ++++++++-------
 pixel_clusterizer/testing/test_clusterizer.py | 74 +++++++-------
 pixel_clusterizer/testing/test_data_types.py  | 98 ++++++++++++++-----
 pixel_clusterizer/testing/test_hit_masking.py | 84 ++++++++--------
 5 files changed, 196 insertions(+), 145 deletions(-)

diff --git a/README.md b/README.md
index 34620d6..f93c530 100644
--- a/README.md
+++ b/README.md
@@ -11,7 +11,7 @@ The hits must be provided in a numpy recarray. The array must contain the follow
 - ```row```
 - ```charge```
 
-If the column names are different, a mapping of the names to the default names can be provided. The data type of each column can vary and is not fixed. The ```column```/```row``` values can be either indices (integer) or positions (float). ```Charge``` can be either integer or float.
+If the column names are different, a mapping of the names to the default names can be provided. The data type of each column can vary and is not fixed. The ```column```/```row``` values can be either indices (integer, default) or positions (float). ```Charge``` can be either integer or float (default).
 
 After clustering, two new arrays are returned:
 1. The cluster hits array is the hits array extended by the following columns:
@@ -64,7 +64,7 @@ import numpy as np
 
 from pixel_clusterizer import clusterizer
 
-hits = np.ones(shape=(3, ), dtype=clusterizer.default_hit_data_type)  # Create some data with std. hit data type
+hits = np.ones(shape=(3, ), dtype=clusterizer.default_hit_dtype)  # Create some data with std. hit data type
 
 cr = clusterizer.HitClusterizer()  # Initialize clusterizer
 
diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 1b6c472..68ead0d 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -1,15 +1,42 @@
 import logging
 import os
+from operator import itemgetter
 
 import numpy as np
 
+default_hit_descr = [
+    ('event_number', '<i8'),
+    ('frame', '<u2'),
+    ('column', '<u2'),
+    ('row', '<u2'),
+    ('charge', '<f4')]
+
+default_hit_dtype = np.dtype(default_hit_descr)
 
-default_hit_data_type = np.dtype([
+default_cluster_hits_descr = [
     ('event_number', '<i8'),
-    ('frame', '<u1'),
+    ('frame', '<u2'),
     ('column', '<u2'),
     ('row', '<u2'),
-    ('charge', '<u2')])
+    ('charge', '<f4'),
+    ('cluster_ID', '<i2'),
+    ('is_seed', '<u1'),
+    ('cluster_size', '<u2'),
+    ('n_cluster', '<u2')]
+
+default_cluster_hits_dtype = np.dtype(default_cluster_hits_descr)
+
+default_clusters_descr = [
+    ('event_number', '<i8'),
+    ('ID', '<u2'),
+    ('n_hits', '<u2'),
+    ('charge', '<f4'),
+    ('seed_column', '<u2'),
+    ('seed_row', '<u2'),
+    ('mean_column', '<f4'),
+    ('mean_row', '<f4')]
+
+default_clusters_dtype = np.dtype(default_clusters_descr)
 
 
 def np_uint_type_chooser(number):
@@ -45,58 +72,28 @@ def __init__(self, hit_fields=None, hit_dtype=None, cluster_fields=None, cluster
         self.cluster_functions = __import__('pixel_clusterizer.cluster_functions').cluster_functions
 
         # Set the translation dictionary for the important hit value names
-        self._default_hit_fields_mapping = {'event_number': 'event_number',
-                                            'frame': 'frame',
-                                            'column': 'column',
-                                            'row': 'row',
-                                            'charge': 'charge',
-                                            'cluster_ID': 'cluster_ID',
-                                            'is_seed': 'is_seed',
-                                            'cluster_size': 'cluster_size',
-                                            'n_cluster': 'n_cluster'}
+        self._default_hit_fields_mapping = {item: item for item in map(itemgetter(0), default_cluster_hits_descr)}
         if hit_fields:
             self.set_hit_fields(hit_fields)
         else:
             self.set_hit_fields(None)
 
         # Set the translation dictionary for the important hit value names
-        self._default_cluster_fields_mapping = {'event_number': 'event_number',
-                                                'ID': 'ID',
-                                                'n_hits': 'n_hits',
-                                                'charge': 'charge',
-                                                'seed_column': 'seed_column',
-                                                'seed_row': 'seed_row',
-                                                'mean_column': 'mean_column',
-                                                'mean_row': 'mean_row'}
+        self._default_cluster_fields_mapping = {item: item for item in map(itemgetter(0), default_clusters_descr)}
         if cluster_fields:
             self.set_cluster_fields(cluster_fields)
         else:
             self.set_cluster_fields(None)
 
         # Set hit data structure for clustered hits
-        self._default_cluster_hits_descr = [('event_number', '<i8'),
-                                            ('frame', '<u1'),
-                                            ('column', '<u2'),
-                                            ('row', '<u2'),
-                                            ('charge', '<u2'),
-                                            ('cluster_ID', '<i2'),
-                                            ('is_seed', '<u1'),
-                                            ('cluster_size', '<u2'),
-                                            ('n_cluster', '<u2')]
+        self._default_cluster_hits_descr = default_cluster_hits_descr
         if hit_dtype:
             self.set_hit_dtype(hit_dtype)
         else:
             self.set_hit_dtype(None)
 
         # Set cluster data struct for clustered hits
-        self._default_cluster_descr = [('event_number', '<i8'),
-                                       ('ID', '<u2'),
-                                       ('n_hits', '<u2'),
-                                       ('charge', '<f4'),
-                                       ('seed_column', '<u2'),
-                                       ('seed_row', '<u2'),
-                                       ('mean_column', '<f4'),
-                                       ('mean_row', '<f4')]
+        self._default_clusters_descr = default_clusters_descr
         if cluster_dtype:
             self.set_cluster_dtype(cluster_dtype)
         else:
@@ -140,7 +137,7 @@ def end_of_event_function(hits, clusters, start_event_hit_index, stop_event_hit_
         self.set_end_of_event_function(end_of_event_function)
 
     def set_hit_fields(self, hit_fields):
-        ''' Tell the clusterizer the meaning of the field names.
+        ''' Tell the clusterizer the meaning of the field names of the cluster hits array.
 
         The hit_fields parameter is a dict, e.g., {"new field name": "standard field name"}.
 
@@ -169,7 +166,7 @@ def set_hit_fields(self, hit_fields):
         self._hit_fields_mapping_inverse = hit_fields_mapping_inverse
 
     def set_cluster_fields(self, cluster_fields):
-        ''' Tell the clusterizer the meaning of the field names.
+        ''' Tell the clusterizer the meaning of the field names of the clusters array.
 
         The cluster_fields parameter is a dict, e.g., {"new filed name": "standard field name"}.
         '''
@@ -190,7 +187,7 @@ def set_cluster_fields(self, cluster_fields):
         self._cluster_fields_mapping_inverse = cluster_fields_mapping_inverse
 
     def set_hit_dtype(self, hit_dtype):
-        ''' Set the data type of the hits.
+        ''' Set the data type of the cluster hits array.
 
         Fields that are not mentioned here are NOT copied into the clustered hits array.
         Clusterizer has to know the hit data type to produce the clustered hit result with the same data types.
@@ -220,7 +217,7 @@ def set_hit_dtype(self, hit_dtype):
         self._init_arrays(size=0)
 
     def set_cluster_dtype(self, cluster_dtype):
-        ''' Set the data type of the cluster.
+        ''' Set the data type of the clusters array.
 
         Parameters:
         -----------
@@ -233,7 +230,7 @@ def set_cluster_dtype(self, cluster_dtype):
             cluster_dtype = np.dtype(cluster_dtype)
         cluster_descr = cluster_dtype.descr
 
-        for dtype_name, dtype in self._default_cluster_descr:
+        for dtype_name, dtype in self._default_clusters_descr:
             if self._cluster_fields_mapping[dtype_name] not in cluster_dtype.fields:
                 cluster_descr.append((dtype_name, dtype))
 
diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index 9be0627..7d3c52e 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -6,10 +6,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_data_type
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_dtype
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_data_type, hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_dtype, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
@@ -36,17 +36,17 @@ def test_exceptions(self):
                        'frame': 'frame'
                        }
         hit_dtype = np.dtype([('event_number', '<i8'),
-                              ('frame', '<u1'),
+                              ('frame', '<u2'),
                               ('column', '<u2'),
                               ('row', '<u2'),
-                              ('charge', '<u2')])
+                              ('charge', '<f4')])
         _ = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype, pure_python=self.pure_python)
         # TEST 2: Set custom clustered hit struct that is incorrect and should throw an exception
         hit_dtype_new = np.dtype([('not_defined', '<i8'),
-                                  ('frame', '<u1'),
+                                  ('frame', '<u2'),
                                   ('column', '<u2'),
                                   ('row', '<u2'),
-                                  ('charge', '<u2')])
+                                  ('charge', '<f4')])
         clusterizer = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype_new, pure_python=self.pure_python)
         with self.assertRaises(TypeError):
             _, _ = clusterizer.cluster_hits(np.array([], dtype=hit_dtype))  # missing "not_defined"
@@ -94,7 +94,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
             ('event_number', '<i8'),
             ('ID', '<u2'),
             ('n_hits', '<u2'),
-            ('charge', 'f4'),
+            ('charge', '<f4'),
             ('seed_column', '<u2'),
             ('seed_row', '<u2'),
             ('mean_column', 'f4'),
@@ -111,10 +111,10 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         # Define expected output
         expected_hit_result = np.zeros(shape=(15, ), dtype=np.dtype([
             ('event_number', '<i8'),
-            ('frame', '<u1'),
+            ('frame', '<u2'),
             ('column', '<u2'),
             ('row', '<u2'),
-            ('charge', '<u2'),
+            ('charge', '<f4'),
             ('cluster_ID', '<i2'),
             ('is_seed', '<u1'),
             ('cluster_size', '<u2'),
@@ -137,7 +137,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=default_hit_data_type)
+        hits = np.ones(shape=(4, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
@@ -150,7 +150,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
             ('event_number', '<i8'),
             ('ID', '<u2'),
             ('n_hits', '<u2'),
-            ('charge', 'f4'),
+            ('charge', '<f4'),
             ('seed_column', '<u2'),
             ('seed_row', '<u2'),
             ('mean_column', 'f4'),
@@ -166,10 +166,10 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         # Define expected output
         expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
             ('event_number', '<i8'),
-            ('frame', '<u1'),
+            ('frame', '<u2'),
             ('column', '<u2'),
             ('row', '<u2'),
-            ('charge', '<u2'),
+            ('charge', '<f4'),
             ('cluster_ID', '<i2'),
             ('is_seed', '<u1'),
             ('cluster_size', '<u2'),
@@ -191,7 +191,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_correction=1, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=default_hit_data_type)
+        hits = np.ones(shape=(4, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
@@ -204,7 +204,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
             ('event_number', '<i8'),
             ('ID', '<u2'),
             ('n_hits', '<u2'),
-            ('charge', 'f4'),
+            ('charge', '<f4'),
             ('seed_column', '<u2'),
             ('seed_row', '<u2'),
             ('mean_column', 'f4'),
@@ -220,10 +220,10 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         # Define expected output
         expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
             ('event_number', '<i8'),
-            ('frame', '<u1'),
+            ('frame', '<u2'),
             ('column', '<u2'),
             ('row', '<u2'),
-            ('charge', '<u2'),
+            ('charge', '<f4'),
             ('cluster_ID', '<i2'),
             ('is_seed', '<u1'),
             ('cluster_size', '<u2'),
@@ -252,7 +252,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -267,10 +267,10 @@ def test_cluster_algorithm(self):  # Basic functionality checks
 
         # Define expected output
         expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
@@ -290,7 +290,7 @@ def test_cluster_algorithm(self):  # Basic functionality checks
 
     def test_cluster_cuts(self):
         # Create some fake data
-        hits = np.ones(shape=(2, ), dtype=default_hit_data_type)
+        hits = np.ones(shape=(2, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 30, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
 
@@ -305,7 +305,7 @@ def test_cluster_cuts(self):
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -320,10 +320,10 @@ def test_cluster_cuts(self):
 
         # Check cluster hit info
         expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -349,7 +349,7 @@ def test_cluster_cuts(self):
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -364,10 +364,10 @@ def test_cluster_cuts(self):
 
         # Check cluster hit info
         expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -388,16 +388,16 @@ def test_cluster_cuts(self):
 
         # Case 3: Add the same hit within an event
         # Create some fake data
-        hits = np.ones(shape=(3, ), dtype=default_hit_data_type)
+        hits = np.ones(shape=(3, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 18, 36, 6, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 18, 38, 6, 19
 
         expected_hit_result = np.zeros(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -405,7 +405,7 @@ def test_cluster_cuts(self):
         expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -459,7 +459,7 @@ def test_set_end_of_cluster_function(self):
         expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -475,10 +475,10 @@ def test_set_end_of_cluster_function(self):
         expected_cluster_result['seed_charge'] = [1., 1., 1., 1.]
 
         expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
@@ -529,7 +529,7 @@ def test_set_end_of_event_function(self):
         expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -545,10 +545,10 @@ def test_set_end_of_event_function(self):
         expected_cluster_result['n_cluster'] = [1, 1, 1, 1]
 
         expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
diff --git a/pixel_clusterizer/testing/test_data_types.py b/pixel_clusterizer/testing/test_data_types.py
index e1529f2..90ba83e 100644
--- a/pixel_clusterizer/testing/test_data_types.py
+++ b/pixel_clusterizer/testing/test_data_types.py
@@ -6,10 +6,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_data_type
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_dtype
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_data_type, hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_dtype, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
@@ -33,10 +33,10 @@ def test_different_hit_data_types(self):
         # recompiles and the result should not change
         hit_data_types = []
         hit_data_types.append([('event_number', '<i8'),
-                               ('frame', '<u1'),
+                               ('frame', '<u2'),
                                ('column', '<u4'),
                                ('row', '<u4'),
-                               ('charge', '<u1'),
+                               ('charge', '<f4'),
                                ('parameter', '<i4')])
         hit_data_types.append([('event_number', '<i4'),
                                ('frame', '<u8'),
@@ -62,7 +62,7 @@ def test_different_hit_data_types(self):
             expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
                                                                             ('ID', '<u2'),
                                                                             ('n_hits', '<u2'),
-                                                                            ('charge', 'f4'),
+                                                                            ('charge', '<f4'),
                                                                             ('seed_column', '<u2'),
                                                                             ('seed_row', '<u2'),
                                                                             ('mean_column', 'f4'),
@@ -115,7 +115,7 @@ def test_different_hit_data_types(self):
             expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
                                                                             ('ID', '<u2'),
                                                                             ('n_hits', '<u2'),
-                                                                            ('charge', 'f4'),
+                                                                            ('charge', '<f4'),
                                                                             ('seed_column', '<u2'),
                                                                             ('seed_row', '<u2'),
                                                                             ('mean_column', 'f4'),
@@ -144,6 +144,60 @@ def test_different_hit_data_types(self):
             self.assertTrue(np.array_equal(clusters, expected_cluster_result))
             self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
+        # Initialize Clusterizer and test charge weighted clustering (charge is float)
+        clusterizer = HitClusterizer(pure_python=self.pure_python, charge_weighted_clustering=True)
+
+        # Create some fake data
+        hits = np.ones(shape=(4, ), dtype=default_hit_dtype)
+        clusterizer.set_hit_dtype(hits.dtype)
+        hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0.0, 19
+        hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10.5, 19
+        hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1.0, 20
+        hits[3]['column'], hits[3]['row'], hits[3]['charge'], hits[3]['event_number'] = 18, 37, 10.5, 20
+
+        cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
+
+        # Define expected output
+        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('ID', '<u2'),
+            ('n_hits', '<u2'),
+            ('charge', '<f4'),
+            ('seed_column', '<u2'),
+            ('seed_row', '<u2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')]))
+        expected_cluster_result['event_number'] = [19, 20]
+        expected_cluster_result['n_hits'] = [2, 2]
+        expected_cluster_result['charge'] = [10.5, 11.5]
+        expected_cluster_result['seed_column'] = [18, 18]
+        expected_cluster_result['seed_row'] = [37, 37]
+        expected_cluster_result['mean_column'] = [18.0, (1.0 * 17 + 10.5 * 18) / 11.5]
+        expected_cluster_result['mean_row'] = [37.0, (1.0 * 36 + 10.5 * 37) / 11.5]
+        # Define expected output
+        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
+            ('event_number', '<i8'),
+            ('frame', '<u2'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<f4'),
+            ('cluster_ID', '<i2'),
+            ('is_seed', '<u1'),
+            ('cluster_size', '<u2'),
+            ('n_cluster', '<u2')]))
+        expected_hit_result['event_number'] = hits['event_number']
+        expected_hit_result['frame'] = hits['frame']
+        expected_hit_result['column'] = hits['column']
+        expected_hit_result['row'] = hits['row']
+        expected_hit_result['charge'] = hits['charge']
+        expected_hit_result['is_seed'] = [0, 1, 0, 1]
+        expected_hit_result['cluster_size'] = [2, 2, 2, 2]
+        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+
+        # Test results
+        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
+        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+
     def test_different_cluster_data_types(self):
         # Define a different hit data structure with standard names but
         # different data types and number of fields. Numba automatically
@@ -195,10 +249,10 @@ def test_different_cluster_data_types(self):
             expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
 
             expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                         ('frame', '<u1'),
+                                                                         ('frame', '<u2'),
                                                                          ('column', '<u2'),
                                                                          ('row', '<u2'),
-                                                                         ('charge', '<u2'),
+                                                                         ('charge', '<f4'),
                                                                          ('cluster_ID', '<i2'),
                                                                          ('is_seed', '<u1'),
                                                                          ('cluster_size', '<u2'),
@@ -243,10 +297,10 @@ def test_different_cluster_data_types(self):
 
             # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
             expected_hit_result = np.zeros(shape=(20, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                         ('frame', '<u1'),
+                                                                         ('frame', '<u2'),
                                                                          ('column', '<u2'),
                                                                          ('row', '<u2'),
-                                                                         ('charge', '<u2'),
+                                                                         ('charge', '<f4'),
                                                                          ('cluster_ID', '<i2'),
                                                                          ('is_seed', '<u1'),
                                                                          ('cluster_size', '<u2'),
@@ -300,7 +354,7 @@ def test_custom_hit_fields(self):
         expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -347,7 +401,7 @@ def test_custom_hit_fields(self):
         expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -415,10 +469,10 @@ def test_custom_cluster_fields(self):
 
         # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
         expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
@@ -463,10 +517,10 @@ def test_custom_cluster_fields(self):
 
         # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
         expected_hit_result = np.zeros(shape=(20, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
@@ -499,7 +553,7 @@ def test_adding_cluster_field(self):
         expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -516,10 +570,10 @@ def test_adding_cluster_field(self):
 
         # Define expected hit clustered output
         expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
@@ -556,7 +610,7 @@ def test_adding_cluster_field(self):
         expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
                                                                         ('ID', '<u2'),
                                                                         ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
+                                                                        ('charge', '<f4'),
                                                                         ('seed_column', '<u2'),
                                                                         ('seed_row', '<u2'),
                                                                         ('mean_column', 'f4'),
@@ -573,10 +627,10 @@ def test_adding_cluster_field(self):
 
         # Define expected hit clustered output
         expected_hit_result = np.zeros(shape=(20, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u1'),
+                                                                     ('frame', '<u2'),
                                                                      ('column', '<u2'),
                                                                      ('row', '<u2'),
-                                                                     ('charge', '<u2'),
+                                                                     ('charge', '<f4'),
                                                                      ('cluster_ID', '<i2'),
                                                                      ('is_seed', '<u1'),
                                                                      ('cluster_size', '<u2'),
diff --git a/pixel_clusterizer/testing/test_hit_masking.py b/pixel_clusterizer/testing/test_hit_masking.py
index 352a0cc..a0454ee 100644
--- a/pixel_clusterizer/testing/test_hit_masking.py
+++ b/pixel_clusterizer/testing/test_hit_masking.py
@@ -8,10 +8,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_data_type
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_dtype
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_data_type, hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_dtype, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
@@ -31,7 +31,7 @@ def setUpClass(cls):
 
     def test_disabled_pixels(self):
         # Create some fake data
-        hits = np.ones(shape=(7, ), dtype=default_hit_data_type)
+        hits = np.ones(shape=(7, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'], hits[0]['frame'] = 1, 2, 4, 0, 0
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'], hits[1]['frame'] = 2, 2, 4, 0, 0
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'], hits[2]['frame'] = 2, 2, 5, 1, 10
@@ -65,10 +65,10 @@ def test_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [2.0, 3.0]
 
         expected_hit_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -89,7 +89,7 @@ def test_disabled_pixels(self):
 
     def test_noisy_pixels(self):
         # Create some fake data
-        hits = np.ones(shape=(9, ), dtype=default_hit_data_type)
+        hits = np.ones(shape=(9, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'], hits[0]['frame'] = 1, 2, 8, 0, 0
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'], hits[1]['frame'] = 2, 2, 4, 0, 0
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'], hits[2]['frame'] = 2, 2, 5, 1, 10
@@ -125,10 +125,10 @@ def test_noisy_pixels(self):
         expected_cluster_result['mean_row'] = [(9 * 2 + 5 * 2) / float(9 + 5), (13 * 2 + 7 * 3 + 4 * 3) / float(13 + 7 + 4), 15]
 
         expected_hit_result = np.zeros(shape=(9, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -149,7 +149,7 @@ def test_noisy_pixels(self):
 
     def test_noisy_and_disabled_pixels(self):
         # Create single hit data
-        hits = np.zeros(shape=(1, ), dtype=default_hit_data_type)
+        hits = np.zeros(shape=(1, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
 
         # Case 1: Test single noisy pixel
@@ -166,10 +166,10 @@ def test_noisy_and_disabled_pixels(self):
                                                                         ('mean_row', 'f4')]))
 
         expected_hit_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -197,7 +197,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create double hit data
-        hits = np.zeros(shape=(2, ), dtype=default_hit_data_type)
+        hits = np.zeros(shape=(2, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
 
@@ -223,10 +223,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [1.5]
 
         expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -259,10 +259,10 @@ def test_noisy_and_disabled_pixels(self):
                                                                         ('mean_row', 'f4')]))
 
         expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -290,7 +290,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create triple hit data
-        hits = np.zeros(shape=(3, ), dtype=default_hit_data_type)
+        hits = np.zeros(shape=(3, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -317,10 +317,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [2.5]
 
         expected_hit_result = np.zeros(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -340,7 +340,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create quadruple hit data
-        hits = np.zeros(shape=(4, ), dtype=default_hit_data_type)
+        hits = np.zeros(shape=(4, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -368,10 +368,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [1.5, 4.0]
 
         expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -412,10 +412,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [2.5]
 
         expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -435,7 +435,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create quintuple hit data
-        hits = np.zeros(shape=(5, ), dtype=default_hit_data_type)
+        hits = np.zeros(shape=(5, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -464,10 +464,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [1.5, 5.0]
 
         expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -508,10 +508,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [3.0]
 
         expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -552,10 +552,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [2.0, 5.0]
 
         expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -596,10 +596,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [2.75]
 
         expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -619,7 +619,7 @@ def test_noisy_and_disabled_pixels(self):
         self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
 
         # Create sextuple hit data
-        hits = np.zeros(shape=(6, ), dtype=default_hit_data_type)
+        hits = np.zeros(shape=(6, ), dtype=default_hit_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -649,10 +649,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [2.0, 5.5]
 
         expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -693,10 +693,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [3.4]
 
         expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -737,10 +737,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [1.5, 6.0]
 
         expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),
@@ -781,10 +781,10 @@ def test_noisy_and_disabled_pixels(self):
         expected_cluster_result['mean_row'] = [3.25]
 
         expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u1'),
+                                                                    ('frame', '<u2'),
                                                                     ('column', '<u2'),
                                                                     ('row', '<u2'),
-                                                                    ('charge', '<u2'),
+                                                                    ('charge', '<f4'),
                                                                     ('cluster_ID', '<i2'),
                                                                     ('is_seed', '<u1'),
                                                                     ('cluster_size', '<u2'),

From 2ee55b33b4a861de48222faf6b92042951dcb03e Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 12:30:47 +0200
Subject: [PATCH 23/28] MAINT: code cleanup

---
 README.md                                     |   2 +-
 pixel_clusterizer/__init__.py                 |   4 +
 pixel_clusterizer/clusterizer.py              |   4 +-
 pixel_clusterizer/testing/test_clusterizer.py | 609 +++++-------
 pixel_clusterizer/testing/test_data_types.py  | 744 ++++++--------
 pixel_clusterizer/testing/test_hit_masking.py | 940 +++++++-----------
 6 files changed, 919 insertions(+), 1384 deletions(-)

diff --git a/README.md b/README.md
index f93c530..a458e36 100644
--- a/README.md
+++ b/README.md
@@ -64,7 +64,7 @@ import numpy as np
 
 from pixel_clusterizer import clusterizer
 
-hits = np.ones(shape=(3, ), dtype=clusterizer.default_hit_dtype)  # Create some data with std. hit data type
+hits = np.ones(shape=(3, ), dtype=clusterizer.default_hits_dtype)  # Create some data with std. hit data type
 
 cr = clusterizer.HitClusterizer()  # Initialize clusterizer
 
diff --git a/pixel_clusterizer/__init__.py b/pixel_clusterizer/__init__.py
index db3fcc7..b9d6a15 100644
--- a/pixel_clusterizer/__init__.py
+++ b/pixel_clusterizer/__init__.py
@@ -1,3 +1,7 @@
 # http://stackoverflow.com/questions/17583443/what-is-the-correct-way-to-share-package-version-with-setup-py-and-the-package
 from pkg_resources import get_distribution
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hits_descr, default_hits_dtype, default_cluster_hits_descr, default_cluster_hits_dtype, default_clusters_descr, default_clusters_dtype
+
+
 __version__ = get_distribution('pixel_clusterizer').version
+_all_ = ["HitClusterizer", "default_hits_dtype", "default_cluster_hits_descr", "default_cluster_hits_dtype", "default_clusters_descr", "default_clusters_dtype"]
diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 68ead0d..b435581 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -4,14 +4,14 @@
 
 import numpy as np
 
-default_hit_descr = [
+default_hits_descr = [
     ('event_number', '<i8'),
     ('frame', '<u2'),
     ('column', '<u2'),
     ('row', '<u2'),
     ('charge', '<f4')]
 
-default_hit_dtype = np.dtype(default_hit_descr)
+default_hits_dtype = np.dtype(default_hits_descr)
 
 default_cluster_hits_descr = [
     ('event_number', '<i8'),
diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index 7d3c52e..68638b3 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -6,10 +6,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_dtype
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hits_dtype, default_clusters_dtype, default_clusters_descr, default_cluster_hits_dtype
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_dtype, hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hits_dtype, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
@@ -29,36 +29,38 @@ def setUpClass(cls):
 
     def test_exceptions(self):
         # TEST 1: Set Custom mapping that is correct and should not throw an exception
-        hit_mapping = {'event_number': 'event_number',
-                       'column': 'column',
-                       'row': 'row',
-                       'charge': 'charge',
-                       'frame': 'frame'
-                       }
-        hit_dtype = np.dtype([('event_number', '<i8'),
-                              ('frame', '<u2'),
-                              ('column', '<u2'),
-                              ('row', '<u2'),
-                              ('charge', '<f4')])
+        hit_mapping = {
+            'event_number': 'event_number',
+            'column': 'column',
+            'row': 'row',
+            'charge': 'charge',
+            'frame': 'frame'}
+        hit_dtype = np.dtype([
+            ('event_number', '<i8'),
+            ('frame', '<u2'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<f4')])
         _ = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype, pure_python=self.pure_python)
         # TEST 2: Set custom clustered hit struct that is incorrect and should throw an exception
-        hit_dtype_new = np.dtype([('not_defined', '<i8'),
-                                  ('frame', '<u2'),
-                                  ('column', '<u2'),
-                                  ('row', '<u2'),
-                                  ('charge', '<f4')])
+        hit_dtype_new = np.dtype([
+            ('not_defined', '<i8'),
+            ('frame', '<u2'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('charge', '<f4')])
         clusterizer = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype_new, pure_python=self.pure_python)
         with self.assertRaises(TypeError):
             _, _ = clusterizer.cluster_hits(np.array([], dtype=hit_dtype))  # missing "not_defined"
         with self.assertRaises(TypeError):
             _, _ = clusterizer.cluster_hits(np.array([], dtype=hit_dtype_new))  # missing "event_number"
         # TEST 3 Set custom and correct hit mapping, no eception expected
-        hit_mapping = {'not_defined': 'event_number',
-                       'column': 'column',
-                       'row': 'row',
-                       'charge': 'charge',
-                       'frame': 'frame'
-                       }
+        hit_mapping = {
+            'not_defined': 'event_number',
+            'column': 'column',
+            'row': 'row',
+            'charge': 'charge',
+            'frame': 'frame'}
         clusterizer = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype_new, pure_python=self.pure_python)
         _, _ = clusterizer.cluster_hits(np.array([], dtype=hit_dtype_new))
 
@@ -90,54 +92,37 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(11, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('ID', '<u2'),
-            ('n_hits', '<u2'),
-            ('charge', '<f4'),
-            ('seed_column', '<u2'),
-            ('seed_row', '<u2'),
-            ('mean_column', 'f4'),
-            ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 0, 1, 1, 2, 2, 3, 3, 3, 4, 4]
-        expected_cluster_result['ID'] = [0, 1, 0, 1, 0, 1, 0, 1, 2, 0, 1]
-        expected_cluster_result['n_hits'] = [2, 1, 2, 1, 2, 1, 1, 1, 1, 1, 1]
-        expected_cluster_result['charge'] = [1.0, 0.0, 1.0, 1.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0]
-        expected_cluster_result['seed_column'] = [2, 4, 4, 7, 7, 7, 10, 11, 12, 13, 14]
-        expected_cluster_result['seed_row'] = [2, 4, 7, 7, 14, 16, 19, 20, 23, 25, 27]
-        expected_cluster_result['mean_column'] = [1.5, 4.0, 4.5, 7.0, 7.0, 7.0, 10.0, 11.0, 12.0, 13.0, 14.0]
-        expected_cluster_result['mean_row'] = [1.5, 4.0, 7.0, 7.0, 13.5, 16.0, 19.0, 20.0, 23.0, 25.0, 27.0]
+        expected_clusters = np.zeros(shape=(11, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 0, 1, 1, 2, 2, 3, 3, 3, 4, 4]
+        expected_clusters['ID'] = [0, 1, 0, 1, 0, 1, 0, 1, 2, 0, 1]
+        expected_clusters['n_hits'] = [2, 1, 2, 1, 2, 1, 1, 1, 1, 1, 1]
+        expected_clusters['charge'] = [1.0, 0.0, 1.0, 1.0, 1.0, 0.0, 1.0, 0.0, 1.0, 0.0, 1.0]
+        expected_clusters['seed_column'] = [2, 4, 4, 7, 7, 7, 10, 11, 12, 13, 14]
+        expected_clusters['seed_row'] = [2, 4, 7, 7, 14, 16, 19, 20, 23, 25, 27]
+        expected_clusters['mean_column'] = [1.5, 4.0, 4.5, 7.0, 7.0, 7.0, 10.0, 11.0, 12.0, 13.0, 14.0]
+        expected_clusters['mean_row'] = [1.5, 4.0, 7.0, 7.0, 13.5, 16.0, 19.0, 20.0, 23.0, 25.0, 27.0]
 
         # Define expected output
-        expected_hit_result = np.zeros(shape=(15, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('frame', '<u2'),
-            ('column', '<u2'),
-            ('row', '<u2'),
-            ('charge', '<f4'),
-            ('cluster_ID', '<i2'),
-            ('is_seed', '<u1'),
-            ('cluster_size', '<u2'),
-            ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 2, 0, 1, -2]
-        expected_hit_result['is_seed'] = [0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0]
-        expected_hit_result['cluster_size'] = [2, 2, 1, 2, 2, 1, 2, 2, 1, 1, 1, 1, 1, 1, 0]
-        expected_hit_result['n_cluster'] = [2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 2, 2, 2]
+        expected_cluster_hits = np.zeros(shape=(15, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 2, 0, 1, -2]
+        expected_cluster_hits['is_seed'] = [0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0]
+        expected_cluster_hits['cluster_size'] = [2, 2, 1, 2, 2, 1, 2, 2, 1, 1, 1, 1, 1, 1, 0]
+        expected_cluster_hits['n_cluster'] = [2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 2, 2, 2]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Initialize Clusterizer and test charge weighted clustering
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(4, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
@@ -146,52 +131,35 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('ID', '<u2'),
-            ('n_hits', '<u2'),
-            ('charge', '<f4'),
-            ('seed_column', '<u2'),
-            ('seed_row', '<u2'),
-            ('mean_column', 'f4'),
-            ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [19, 20]
-        expected_cluster_result['n_hits'] = [2, 2]
-        expected_cluster_result['charge'] = [10.0, 11.0]
-        expected_cluster_result['seed_column'] = [18, 18]
-        expected_cluster_result['seed_row'] = [37, 37]
-        expected_cluster_result['mean_column'] = [18.0, (1.0 * 17 + 10.0 * 18) / 11.0]
-        expected_cluster_result['mean_row'] = [37.0, (1.0 * 36 + 10.0 * 37) / 11.0]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [19, 20]
+        expected_clusters['n_hits'] = [2, 2]
+        expected_clusters['charge'] = [10.0, 11.0]
+        expected_clusters['seed_column'] = [18, 18]
+        expected_clusters['seed_row'] = [37, 37]
+        expected_clusters['mean_column'] = [18.0, (1.0 * 17 + 10.0 * 18) / 11.0]
+        expected_clusters['mean_row'] = [37.0, (1.0 * 36 + 10.0 * 37) / 11.0]
 
         # Define expected output
-        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('frame', '<u2'),
-            ('column', '<u2'),
-            ('row', '<u2'),
-            ('charge', '<f4'),
-            ('cluster_ID', '<i2'),
-            ('is_seed', '<u1'),
-            ('cluster_size', '<u2'),
-            ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 2, 2]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+        expected_cluster_hits = np.zeros(shape=(4, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 2, 2]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Initialize Clusterizer and test charge weighted clustering and charge correction
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_correction=1, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(4, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 17, 36, 1, 20
@@ -200,46 +168,29 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('ID', '<u2'),
-            ('n_hits', '<u2'),
-            ('charge', '<f4'),
-            ('seed_column', '<u2'),
-            ('seed_row', '<u2'),
-            ('mean_column', 'f4'),
-            ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [19, 20]
-        expected_cluster_result['n_hits'] = [2, 2]
-        expected_cluster_result['charge'] = [10.0, 11.0]
-        expected_cluster_result['seed_column'] = [18, 18]
-        expected_cluster_result['seed_row'] = [37, 37]
-        expected_cluster_result['mean_column'] = [(1.0 * 17 + 11.0 * 18) / 12.0, (2.0 * 17 + 11.0 * 18) / 13.0]
-        expected_cluster_result['mean_row'] = [(1.0 * 36 + 11.0 * 37) / 12.0, (2.0 * 36 + 11.0 * 37) / 13.0]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [19, 20]
+        expected_clusters['n_hits'] = [2, 2]
+        expected_clusters['charge'] = [10.0, 11.0]
+        expected_clusters['seed_column'] = [18, 18]
+        expected_clusters['seed_row'] = [37, 37]
+        expected_clusters['mean_column'] = [(1.0 * 17 + 11.0 * 18) / 12.0, (2.0 * 17 + 11.0 * 18) / 13.0]
+        expected_clusters['mean_row'] = [(1.0 * 36 + 11.0 * 37) / 12.0, (2.0 * 36 + 11.0 * 37) / 13.0]
 
         # Define expected output
-        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('frame', '<u2'),
-            ('column', '<u2'),
-            ('row', '<u2'),
-            ('charge', '<f4'),
-            ('cluster_ID', '<i2'),
-            ('is_seed', '<u1'),
-            ('cluster_size', '<u2'),
-            ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 2, 2]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+        expected_cluster_hits = np.zeros(shape=(4, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 2, 2]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Initialize Clusterizer
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
@@ -249,48 +200,33 @@ def test_cluster_algorithm(self):  # Basic functionality checks
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-        expected_cluster_result['charge'] = [1, 2, 1, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+        expected_clusters = np.zeros(shape=(4, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 1, 2, 3]
+        expected_clusters['n_hits'] = [3, 3, 3, 1]
+        expected_clusters['charge'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
 
         # Define expected output
-        expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_cluster_cuts(self):
         # Create some fake data
-        hits = np.ones(shape=(2, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(2, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 30, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
 
@@ -302,152 +238,107 @@ def test_cluster_cuts(self):
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Check cluster
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [19]
-        expected_cluster_result['n_hits'] = [2]
-        expected_cluster_result['charge'] = [36]
-        expected_cluster_result['seed_column'] = [17]
-        expected_cluster_result['seed_row'] = [36]
-        expected_cluster_result['mean_column'] = [17.18420982]
-        expected_cluster_result['mean_row'] = [36.0]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [19]
+        expected_clusters['n_hits'] = [2]
+        expected_clusters['charge'] = [36]
+        expected_clusters['seed_column'] = [17]
+        expected_clusters['seed_row'] = [36]
+        expected_clusters['mean_column'] = [17.18420982]
+        expected_clusters['mean_row'] = [36.0]
 
         # Check cluster hit info
-        expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [1, 0]
-        expected_hit_result['cluster_size'] = [2, 2]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(2, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [1, 0]
+        expected_cluster_hits['cluster_size'] = [2, 2]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 2: Test max hit charge cut, omit hits with charge > 29
         hits['event_number'] = 20
         clusterizer.set_max_hit_charge(29)  # only add hits with charge <= 30
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
         # Check cluster
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [20]
-        expected_cluster_result['n_hits'] = [1]
-        expected_cluster_result['charge'] = [6]
-        expected_cluster_result['seed_column'] = [18]
-        expected_cluster_result['seed_row'] = [36]
-        expected_cluster_result['mean_column'] = [18.0]
-        expected_cluster_result['mean_row'] = [36.0]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [20]
+        expected_clusters['n_hits'] = [1]
+        expected_clusters['charge'] = [6]
+        expected_clusters['seed_column'] = [18]
+        expected_clusters['seed_row'] = [36]
+        expected_clusters['mean_column'] = [18.0]
+        expected_clusters['mean_row'] = [36.0]
 
         # Check cluster hit info
-        expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [-1, 0]
-        expected_hit_result['is_seed'] = [0, 1]
-        expected_hit_result['cluster_size'] = [0, 1]
-        expected_hit_result['n_cluster'] = [1, 1]
+        expected_cluster_hits = np.zeros(shape=(2, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [-1, 0]
+        expected_cluster_hits['is_seed'] = [0, 1]
+        expected_cluster_hits['cluster_size'] = [0, 1]
+        expected_cluster_hits['n_cluster'] = [1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 3: Add the same hit within an event
         # Create some fake data
-        hits = np.ones(shape=(3, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(3, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 18, 36, 6, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 36, 6, 19
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'] = 18, 38, 6, 19
 
-        expected_hit_result = np.zeros(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, -2, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0]
-        expected_hit_result['cluster_size'] = [2, 0, 2]
-        expected_hit_result['n_cluster'] = [1, 1, 1]
-        expected_cluster_result['event_number'] = [19]
-        expected_cluster_result['n_hits'] = [2]
-        expected_cluster_result['charge'] = [12]
-        expected_cluster_result['seed_column'] = [18]
-        expected_cluster_result['seed_row'] = [36]
-        expected_cluster_result['mean_column'] = [18.0]
-        expected_cluster_result['mean_row'] = [37.0]
+        expected_cluster_hits = np.zeros(shape=(3, ), dtype=default_cluster_hits_dtype)
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, -2, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0]
+        expected_cluster_hits['cluster_size'] = [2, 0, 2]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1]
+        expected_clusters['event_number'] = [19]
+        expected_clusters['n_hits'] = [2]
+        expected_clusters['charge'] = [12]
+        expected_clusters['seed_column'] = [18]
+        expected_clusters['seed_row'] = [36]
+        expected_clusters['mean_column'] = [18.0]
+        expected_clusters['mean_row'] = [37.0]
 
         clusterizer.ignore_same_hits(True)  # If a hit occurred 2 times in an event it is ignored and gets the cluster index -2
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # Cluster hits
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         clusterizer.ignore_same_hits(False)  # If a hit occurred 2 times in an event it is used as a normal hit
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # Cluster hits
 
-        expected_hit_result['cluster_ID'] = [0, 0, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0]
-        expected_hit_result['cluster_size'] = [3, 3, 3]
-        expected_hit_result['n_cluster'] = [1, 1, 1]
-        expected_cluster_result['n_hits'] = [3]
-        expected_cluster_result['charge'] = [18]
-        expected_cluster_result['mean_row'] = [(2 * 36 + 38) / 3.0]
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1]
+        expected_clusters['n_hits'] = [3]
+        expected_clusters['charge'] = [18]
+        expected_clusters['mean_row'] = [(2 * 36 + 38) / 3.0]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_set_end_of_cluster_function(self):
         # Initialize clusterizer object
@@ -456,41 +347,28 @@ def test_set_end_of_cluster_function(self):
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4'),
-                                                                        ('seed_charge', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-        expected_cluster_result['charge'] = [1, 2, 1, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
-        expected_cluster_result['seed_charge'] = [1., 1., 1., 1.]
-
-        expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-        expected_hit_result['n_cluster'] = 1
+        modified_clusters_descr = default_clusters_descr[:]
+        modified_clusters_descr.append(('seed_charge', 'f4'))
+        expected_clusters = np.zeros(shape=(4, ), dtype=np.dtype(modified_clusters_descr))
+
+        expected_clusters['event_number'] = [0, 1, 2, 3]
+        expected_clusters['n_hits'] = [3, 3, 3, 1]
+        expected_clusters['charge'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+        expected_clusters['seed_charge'] = [1., 1., 1., 1.]
+
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
 
         clusterizer.add_cluster_field(description=('seed_charge', 'f4'))  # Add an additional field to hold the result of the end_of_cluster_function calculation (here: seed charge)
 
@@ -506,8 +384,8 @@ def end_of_cluster_function(hits, clusters, cluster_size, cluster_hit_indices, c
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         end_of_cluster_function_jitted = clusterizer._jitted(end_of_cluster_function)
         clusterizer.set_end_of_cluster_function(end_of_cluster_function_jitted)  # Set jitted end_of_cluster_function
@@ -516,8 +394,8 @@ def end_of_cluster_function(hits, clusters, cluster_size, cluster_hit_indices, c
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_set_end_of_event_function(self):
         # Initialize clusterizer object
@@ -526,43 +404,30 @@ def test_set_end_of_event_function(self):
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4'),
-                                                                        ('n_cluster', '<u1')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-        expected_cluster_result['charge'] = [1, 2, 1, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
-        expected_cluster_result['n_cluster'] = [1, 1, 1, 1]
-
-        expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-        expected_hit_result['n_cluster'] = 1
-
-        clusterizer.add_cluster_field(description=('n_cluster', '<u1'))  # Add an additional field to hold the result of the end_of_cluster_function calculation (here: seed charge)
+        modified_clusters_descr = default_clusters_descr[:]
+        modified_clusters_descr.append(('n_cluster', '<u2'))
+        expected_clusters = np.zeros(shape=(4, ), dtype=np.dtype(modified_clusters_descr))
+
+        expected_clusters['event_number'] = [0, 1, 2, 3]
+        expected_clusters['n_hits'] = [3, 3, 3, 1]
+        expected_clusters['charge'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+        expected_clusters['n_cluster'] = [1, 1, 1, 1]
+
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
+
+        clusterizer.add_cluster_field(description=('n_cluster', '<u2'))  # Add an additional field to hold the result of the end_of_cluster_function calculation (here: seed charge)
 
         # The end of loop function has to define all of the following arguments, even when they are not used
         # It has to be compile able by numba in non python mode
@@ -578,8 +443,8 @@ def end_of_event_function(hits, clusters, start_event_hit_index, stop_event_hit_
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         end_of_event_function_jitted = clusterizer._jitted(end_of_event_function)
         clusterizer.set_end_of_event_function(end_of_event_function_jitted)  # Set jitted end_of_cluster_function
@@ -588,16 +453,18 @@ def end_of_event_function(hits, clusters, start_event_hit_index, stop_event_hit_
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_chunked_clustering(self):  # Big tables have to be chunked and analyzed with clusterizer.cluster_hits(hits_chunk) calls
-        clusterizer = HitClusterizer(pure_python=self.pure_python,
-                                     min_hit_charge=0, max_hit_charge=13,
-                                     column_cluster_distance=2,
-                                     row_cluster_distance=2,
-                                     frame_cluster_distance=4,
-                                     ignore_same_hits=True)
+        clusterizer = HitClusterizer(
+            pure_python=self.pure_python,
+            min_hit_charge=0,
+            max_hit_charge=13,
+            column_cluster_distance=2,
+            row_cluster_distance=2,
+            frame_cluster_distance=4,
+            ignore_same_hits=True)
 
         n_hits = 100
         hits = create_hits(n_hits=n_hits, max_column=100, max_row=100, max_frame=1, max_charge=2)
diff --git a/pixel_clusterizer/testing/test_data_types.py b/pixel_clusterizer/testing/test_data_types.py
index 90ba83e..652d9e5 100644
--- a/pixel_clusterizer/testing/test_data_types.py
+++ b/pixel_clusterizer/testing/test_data_types.py
@@ -6,10 +6,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_dtype
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hits_dtype, default_clusters_dtype, default_clusters_descr, default_cluster_hits_dtype
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_dtype, hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hits_dtype, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
@@ -32,20 +32,22 @@ def test_different_hit_data_types(self):
         # different data types and number of fields. Numba automatically
         # recompiles and the result should not change
         hit_data_types = []
-        hit_data_types.append([('event_number', '<i8'),
-                               ('frame', '<u2'),
-                               ('column', '<u4'),
-                               ('row', '<u4'),
-                               ('charge', '<f4'),
-                               ('parameter', '<i4')])
-        hit_data_types.append([('event_number', '<i4'),
-                               ('frame', '<u8'),
-                               ('column', '<u2'),
-                               ('row', '<i2'),
-                               ('charge', '<u1'),
-                               ('parameter', '<u1'),
-                               ('parameter_1', '<i4'),
-                               ('parameter_2', 'f4')])
+        hit_data_types.append([
+            ('event_number', '<i8'),
+            ('frame', '<u2'),
+            ('column', '<u4'),
+            ('row', '<u4'),
+            ('charge', '<f4'),
+            ('parameter', '<i4')])
+        hit_data_types.append([
+            ('event_number', '<i4'),
+            ('frame', '<u8'),
+            ('column', '<u2'),
+            ('row', '<i2'),
+            ('charge', '<u1'),
+            ('parameter', '<u1'),
+            ('parameter_1', '<i4'),
+            ('parameter_2', 'f4')])
 
         # Initialize clusterizer
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
@@ -59,41 +61,35 @@ def test_different_hit_data_types(self):
             array_size_before = clusterizer._clusters.shape[0]
 
             # Define expected output
-            expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                            ('ID', '<u2'),
-                                                                            ('n_hits', '<u2'),
-                                                                            ('charge', '<f4'),
-                                                                            ('seed_column', '<u2'),
-                                                                            ('seed_row', '<u2'),
-                                                                            ('mean_column', 'f4'),
-                                                                            ('mean_row', 'f4')]))
-            expected_cluster_result['event_number'] = [0, 1, 2, 3]
-            expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-            expected_cluster_result['charge'] = [1, 2, 1, 1]
-            expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-            expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-            expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-            expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+            expected_clusters = np.zeros(shape=(4, ), dtype=default_clusters_dtype)
+            expected_clusters['event_number'] = [0, 1, 2, 3]
+            expected_clusters['n_hits'] = [3, 3, 3, 1]
+            expected_clusters['charge'] = [1, 2, 1, 1]
+            expected_clusters['seed_column'] = [2, 4, 8, 10]
+            expected_clusters['seed_row'] = [3, 7, 15, 19]
+            expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+            expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
 
             # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-            hit_data_type.extend([('cluster_ID', '<i2'),
-                                  ('is_seed', '<u1'),
-                                  ('cluster_size', '<u2'),
-                                  ('n_cluster', '<u2')])
-            expected_hit_result = np.zeros(shape=(10, ), dtype=hit_data_type)
-            expected_hit_result['event_number'] = hits['event_number']
-            expected_hit_result['frame'] = hits['frame']
-            expected_hit_result['column'] = hits['column']
-            expected_hit_result['row'] = hits['row']
-            expected_hit_result['charge'] = hits['charge']
-            expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-            expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-            expected_hit_result['n_cluster'] = 1
-            expected_hit_result['parameter'] = 1  # was set to 1 before and copied to the cluster hits array
+            hit_data_type.extend([
+                ('cluster_ID', '<i2'),
+                ('is_seed', '<u1'),
+                ('cluster_size', '<u2'),
+                ('n_cluster', '<u2')])
+            expected_cluster_hits = np.zeros(shape=(10, ), dtype=hit_data_type)
+            expected_cluster_hits['event_number'] = hits['event_number']
+            expected_cluster_hits['frame'] = hits['frame']
+            expected_cluster_hits['column'] = hits['column']
+            expected_cluster_hits['row'] = hits['row']
+            expected_cluster_hits['charge'] = hits['charge']
+            expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+            expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+            expected_cluster_hits['n_cluster'] = 1
+            expected_cluster_hits['parameter'] = 1  # was set to 1 before and copied to the cluster hits array
 
             # Test results
-            self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-            self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+            self.assertTrue(np.array_equal(clusters, expected_clusters))
+            self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
             # Test same size array
             hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2, hit_dtype=np.dtype(hit_data_type))
@@ -102,9 +98,9 @@ def test_different_hit_data_types(self):
 
             # Test results
             self.assertTrue(array_size_before == array_size_after)
-            self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-            expected_hit_result['parameter'] = 0  # created new hits, this is zero again
-            self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+            self.assertTrue(np.array_equal(clusters, expected_clusters))
+            expected_cluster_hits['parameter'] = 0  # created new hits, this is zero again
+            self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
             # Test increasing size array
             hits = create_hits(n_hits=20, max_column=100, max_row=100, max_frame=1, max_charge=2, hit_dtype=np.dtype(hit_data_type))
@@ -112,43 +108,36 @@ def test_different_hit_data_types(self):
             array_size_after = clusterizer._clusters.shape[0]
 
             # Define expected output
-            expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                            ('ID', '<u2'),
-                                                                            ('n_hits', '<u2'),
-                                                                            ('charge', '<f4'),
-                                                                            ('seed_column', '<u2'),
-                                                                            ('seed_row', '<u2'),
-                                                                            ('mean_column', 'f4'),
-                                                                            ('mean_row', 'f4')]))
-            expected_cluster_result['event_number'] = [0, 1, 2, 3, 4, 5, 6]
-            expected_cluster_result['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
-            expected_cluster_result['charge'] = [1, 2, 1, 2, 1, 2, 1]
-            expected_cluster_result['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
-            expected_cluster_result['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
-            expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
-            expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
+            expected_clusters = np.zeros(shape=(7, ), dtype=default_clusters_dtype)
+            expected_clusters['event_number'] = [0, 1, 2, 3, 4, 5, 6]
+            expected_clusters['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
+            expected_clusters['charge'] = [1, 2, 1, 2, 1, 2, 1]
+            expected_clusters['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
+            expected_clusters['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
+            expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
+            expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
 
             # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-            expected_hit_result = np.zeros(shape=(20, ), dtype=hit_data_type)
-            expected_hit_result['event_number'] = hits['event_number']
-            expected_hit_result['frame'] = hits['frame']
-            expected_hit_result['column'] = hits['column']
-            expected_hit_result['row'] = hits['row']
-            expected_hit_result['charge'] = hits['charge']
-            expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
-            expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
-            expected_hit_result['n_cluster'] = 1
+            expected_cluster_hits = np.zeros(shape=(20, ), dtype=hit_data_type)
+            expected_cluster_hits['event_number'] = hits['event_number']
+            expected_cluster_hits['frame'] = hits['frame']
+            expected_cluster_hits['column'] = hits['column']
+            expected_cluster_hits['row'] = hits['row']
+            expected_cluster_hits['charge'] = hits['charge']
+            expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
+            expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
+            expected_cluster_hits['n_cluster'] = 1
 
             # Test results
             self.assertTrue(array_size_before < array_size_after)
-            self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-            self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+            self.assertTrue(np.array_equal(clusters, expected_clusters))
+            self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Initialize Clusterizer and test charge weighted clustering (charge is float)
         clusterizer = HitClusterizer(pure_python=self.pure_python, charge_weighted_clustering=True)
 
         # Create some fake data
-        hits = np.ones(shape=(4, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(4, ), dtype=default_hits_dtype)
         clusterizer.set_hit_dtype(hits.dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'] = 17, 36, 0.0, 19
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'] = 18, 37, 10.5, 19
@@ -158,78 +147,64 @@ def test_different_hit_data_types(self):
         cluster_hits, clusters = clusterizer.cluster_hits(hits)  # cluster hits
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('ID', '<u2'),
-            ('n_hits', '<u2'),
-            ('charge', '<f4'),
-            ('seed_column', '<u2'),
-            ('seed_row', '<u2'),
-            ('mean_column', 'f4'),
-            ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [19, 20]
-        expected_cluster_result['n_hits'] = [2, 2]
-        expected_cluster_result['charge'] = [10.5, 11.5]
-        expected_cluster_result['seed_column'] = [18, 18]
-        expected_cluster_result['seed_row'] = [37, 37]
-        expected_cluster_result['mean_column'] = [18.0, (1.0 * 17 + 10.5 * 18) / 11.5]
-        expected_cluster_result['mean_row'] = [37.0, (1.0 * 36 + 10.5 * 37) / 11.5]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [19, 20]
+        expected_clusters['n_hits'] = [2, 2]
+        expected_clusters['charge'] = [10.5, 11.5]
+        expected_clusters['seed_column'] = [18, 18]
+        expected_clusters['seed_row'] = [37, 37]
+        expected_clusters['mean_column'] = [18.0, (1.0 * 17 + 10.5 * 18) / 11.5]
+        expected_clusters['mean_row'] = [37.0, (1.0 * 36 + 10.5 * 37) / 11.5]
         # Define expected output
-        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([
-            ('event_number', '<i8'),
-            ('frame', '<u2'),
-            ('column', '<u2'),
-            ('row', '<u2'),
-            ('charge', '<f4'),
-            ('cluster_ID', '<i2'),
-            ('is_seed', '<u1'),
-            ('cluster_size', '<u2'),
-            ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 2, 2]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+        expected_cluster_hits = np.zeros(shape=(4, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 2, 2]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_different_cluster_data_types(self):
         # Define a different hit data structure with standard names but
         # different data types and number of fields. Numba automatically
         # recompiles and the result should not change
         cluster_data_types = []
-        cluster_data_types.append([('event_number', '<f8'),
-                                   ('ID', '<u2'),
-                                   ('n_hits', '<u2'),
-                                   ('charge', 'f4'),
-                                   ('seed_column', '<i2'),
-                                   ('seed_row', '<i2'),
-                                   ('mean_column', 'f4'),
-                                   ('mean_row', 'f4')])
-        cluster_data_types.append([('event_number', '<u8'),
-                                   ('ID', '<u2'),
-                                   ('n_hits', '<u2'),
-                                   ('charge', 'u4'),
-                                   ('seed_column', '<u2'),
-                                   ('seed_row', '<u2'),
-                                   ('mean_column', 'f4'),
-                                   ('mean_row', 'f4')])
+        cluster_data_types.append([
+            ('event_number', '<f8'),
+            ('ID', '<u2'),
+            ('n_hits', '<u2'),
+            ('charge', 'f4'),
+            ('seed_column', '<i2'),
+            ('seed_row', '<i2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')])
+        cluster_data_types.append([
+            ('event_number', '<u8'),
+            ('ID', '<u2'),
+            ('n_hits', '<u2'),
+            ('charge', 'u4'),
+            ('seed_column', '<u2'),
+            ('seed_row', '<u2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')])
 
         # Initialize clusterizer
-        clusterizer = HitClusterizer(pure_python=self.pure_python,
-                                     min_hit_charge=0,
-                                     max_hit_charge=13,
-                                     charge_correction=1,
-                                     charge_weighted_clustering=True,
-                                     column_cluster_distance=2,
-                                     row_cluster_distance=2,
-                                     frame_cluster_distance=4,
-                                     ignore_same_hits=True)
+        clusterizer = HitClusterizer(
+            pure_python=self.pure_python,
+            min_hit_charge=0,
+            max_hit_charge=13,
+            charge_correction=1,
+            charge_weighted_clustering=True,
+            column_cluster_distance=2,
+            row_cluster_distance=2,
+            frame_cluster_distance=4,
+            ignore_same_hits=True)
 
         for cluster_data_type in cluster_data_types:
             clusterizer.set_cluster_dtype(np.dtype(cluster_data_type))
@@ -239,36 +214,28 @@ def test_different_cluster_data_types(self):
             array_size_before = clusterizer._clusters.shape[0]
 
             # Define expected output
-            expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype(cluster_data_type))
-            expected_cluster_result['event_number'] = [0, 1, 2, 3]
-            expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-            expected_cluster_result['charge'] = [1, 2, 1, 1]
-            expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-            expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-            expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-            expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
-
-            expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                         ('frame', '<u2'),
-                                                                         ('column', '<u2'),
-                                                                         ('row', '<u2'),
-                                                                         ('charge', '<f4'),
-                                                                         ('cluster_ID', '<i2'),
-                                                                         ('is_seed', '<u1'),
-                                                                         ('cluster_size', '<u2'),
-                                                                         ('n_cluster', '<u2')]))
-            expected_hit_result['event_number'] = hits['event_number']
-            expected_hit_result['frame'] = hits['frame']
-            expected_hit_result['column'] = hits['column']
-            expected_hit_result['row'] = hits['row']
-            expected_hit_result['charge'] = hits['charge']
-            expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-            expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-            expected_hit_result['n_cluster'] = 1
+            expected_clusters = np.zeros(shape=(4, ), dtype=np.dtype(cluster_data_type))
+            expected_clusters['event_number'] = [0, 1, 2, 3]
+            expected_clusters['n_hits'] = [3, 3, 3, 1]
+            expected_clusters['charge'] = [1, 2, 1, 1]
+            expected_clusters['seed_column'] = [2, 4, 8, 10]
+            expected_clusters['seed_row'] = [3, 7, 15, 19]
+            expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+            expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+
+            expected_cluster_hits = np.zeros(shape=(10, ), dtype=default_cluster_hits_dtype)
+            expected_cluster_hits['event_number'] = hits['event_number']
+            expected_cluster_hits['frame'] = hits['frame']
+            expected_cluster_hits['column'] = hits['column']
+            expected_cluster_hits['row'] = hits['row']
+            expected_cluster_hits['charge'] = hits['charge']
+            expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+            expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+            expected_cluster_hits['n_cluster'] = 1
 
             # Test results
-            self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-            self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+            self.assertTrue(np.array_equal(clusters, expected_clusters))
+            self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
             # Test same size array
             hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -277,8 +244,8 @@ def test_different_cluster_data_types(self):
 
             # Test results
             self.assertTrue(array_size_before == array_size_after)
-            self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-            self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+            self.assertTrue(np.array_equal(clusters, expected_clusters))
+            self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
             # Test increasing size array
             hits = create_hits(n_hits=20, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -286,63 +253,57 @@ def test_different_cluster_data_types(self):
             array_size_after = clusterizer._clusters.shape[0]
 
             # Define expected output
-            expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype(cluster_data_type))
-            expected_cluster_result['event_number'] = [0, 1, 2, 3, 4, 5, 6]
-            expected_cluster_result['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
-            expected_cluster_result['charge'] = [1, 2, 1, 2, 1, 2, 1]
-            expected_cluster_result['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
-            expected_cluster_result['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
-            expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
-            expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
+            expected_clusters = np.zeros(shape=(7, ), dtype=np.dtype(cluster_data_type))
+            expected_clusters['event_number'] = [0, 1, 2, 3, 4, 5, 6]
+            expected_clusters['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
+            expected_clusters['charge'] = [1, 2, 1, 2, 1, 2, 1]
+            expected_clusters['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
+            expected_clusters['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
+            expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
+            expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
 
             # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-            expected_hit_result = np.zeros(shape=(20, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                         ('frame', '<u2'),
-                                                                         ('column', '<u2'),
-                                                                         ('row', '<u2'),
-                                                                         ('charge', '<f4'),
-                                                                         ('cluster_ID', '<i2'),
-                                                                         ('is_seed', '<u1'),
-                                                                         ('cluster_size', '<u2'),
-                                                                         ('n_cluster', '<u2')]))
-            expected_hit_result['event_number'] = hits['event_number']
-            expected_hit_result['frame'] = hits['frame']
-            expected_hit_result['column'] = hits['column']
-            expected_hit_result['row'] = hits['row']
-            expected_hit_result['charge'] = hits['charge']
-            expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
-            expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
-            expected_hit_result['n_cluster'] = 1
+            expected_cluster_hits = np.zeros(shape=(20, ), dtype=default_cluster_hits_dtype)
+            expected_cluster_hits['event_number'] = hits['event_number']
+            expected_cluster_hits['frame'] = hits['frame']
+            expected_cluster_hits['column'] = hits['column']
+            expected_cluster_hits['row'] = hits['row']
+            expected_cluster_hits['charge'] = hits['charge']
+            expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
+            expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
+            expected_cluster_hits['n_cluster'] = 1
 
             # Test results
             self.assertTrue(array_size_before < array_size_after)
-            self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-            self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+            self.assertTrue(np.array_equal(clusters, expected_clusters))
+            self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_custom_hit_fields(self):
         # Define a different hit data structure with different names but standard data types.
-        hit_dtype = np.dtype([('eventNumber', '<i8'),
-                              ('relBCID', '<u1'),
-                              ('column', '<u2'),
-                              ('row', '<u2'),
-                              ('tot', '<u2')])
-
-        hit_clustered_dtype = np.dtype([('eventNumber', '<i8'),
-                                        ('relBCID', '<u1'),
-                                        ('column', '<u2'),
-                                        ('row', '<u2'),
-                                        ('tot', '<u2'),
-                                        ('cluster_ID', '<i2'),
-                                        ('is_seed', '<u1'),
-                                        ('cluster_size', '<u2'),
-                                        ('n_cluster', '<u2')])
-
-        hit_fields = {'eventNumber': 'event_number',
-                      'column': 'column',
-                      'row': 'row',
-                      'tot': 'charge',
-                      'relBCID': 'frame'
-                      }
+        hit_dtype = np.dtype([
+            ('eventNumber', '<i8'),
+            ('relBCID', '<u1'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('tot', '<u2')])
+
+        hit_clustered_dtype = np.dtype([
+            ('eventNumber', '<i8'),
+            ('relBCID', '<u1'),
+            ('column', '<u2'),
+            ('row', '<u2'),
+            ('tot', '<u2'),
+            ('cluster_ID', '<i2'),
+            ('is_seed', '<u1'),
+            ('cluster_size', '<u2'),
+            ('n_cluster', '<u2')])
+
+        hit_fields = {
+            'eventNumber': 'event_number',
+            'column': 'column',
+            'row': 'row',
+            'tot': 'charge',
+            'relBCID': 'frame'}
 
         # Initialize clusterizer and cluster test hits with self defined data type names
         clusterizer = HitClusterizer(hit_fields=hit_fields, hit_dtype=hit_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
@@ -351,36 +312,29 @@ def test_custom_hit_fields(self):
         array_size_before = clusterizer._clusters.shape[0]
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-        expected_cluster_result['charge'] = [1, 2, 1, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+        expected_clusters = np.zeros(shape=(4, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 1, 2, 3]
+        expected_clusters['n_hits'] = [3, 3, 3, 1]
+        expected_clusters['charge'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
 
         # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-        expected_hit_result = np.zeros(shape=(10, ), dtype=hit_clustered_dtype)
-        expected_hit_result['eventNumber'] = hits['eventNumber']
-        expected_hit_result['relBCID'] = hits['relBCID']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['tot'] = hits['tot']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=hit_clustered_dtype)
+        expected_cluster_hits['eventNumber'] = hits['eventNumber']
+        expected_cluster_hits['relBCID'] = hits['relBCID']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['tot'] = hits['tot']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Test same size array
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2, hit_dtype=hit_dtype, hit_fields=hit_fields)
@@ -389,8 +343,8 @@ def test_custom_hit_fields(self):
 
         # Test results
         self.assertTrue(array_size_before == array_size_after)
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Test increasing size array
         hits = create_hits(n_hits=20, max_column=100, max_row=100, max_frame=1, max_charge=2, hit_dtype=hit_dtype, hit_fields=hit_fields)
@@ -398,97 +352,83 @@ def test_custom_hit_fields(self):
         array_size_after = clusterizer._clusters.shape[0]
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3, 4, 5, 6]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
-        expected_cluster_result['charge'] = [1, 2, 1, 2, 1, 2, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
+        expected_clusters = np.zeros(shape=(7, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 1, 2, 3, 4, 5, 6]
+        expected_clusters['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
+        expected_clusters['charge'] = [1, 2, 1, 2, 1, 2, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
+        expected_clusters['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
 
         # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-        expected_hit_result = np.zeros(shape=(20, ), dtype=hit_clustered_dtype)
-        expected_hit_result['eventNumber'] = hits['eventNumber']
-        expected_hit_result['relBCID'] = hits['relBCID']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['tot'] = hits['tot']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(20, ), dtype=hit_clustered_dtype)
+        expected_cluster_hits['eventNumber'] = hits['eventNumber']
+        expected_cluster_hits['relBCID'] = hits['relBCID']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['tot'] = hits['tot']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
         self.assertTrue(array_size_before < array_size_after)
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_custom_cluster_fields(self):
         # Define a different cluster data structure with different names but standard data types.
-        cluster_dtype = np.dtype([('eventNumber', '<i8'),
-                                  ('ID', '<u2'),
-                                  ('size', '<u2'),
-                                  ('tot', 'f4'),
-                                  ('seed_column', '<u2'),
-                                  ('seed_row', '<u2'),
-                                  ('mean_column', 'f4'),
-                                  ('mean_row', 'f4')])
-
-        cluster_fields = {'eventNumber': 'event_number',
-                          'ID': 'ID',
-                          'size': 'n_hits',
-                          'tot': 'charge',
-                          'seed_column': 'seed_column',
-                          'seed_row': 'seed_row',
-                          'mean_column': 'mean_column',
-                          'mean_row': 'mean_row'
-                          }
+        clusters_dtype = np.dtype([
+            ('eventNumber', '<i8'),
+            ('ID', '<u2'),
+            ('size', '<u2'),
+            ('tot', 'f4'),
+            ('seed_column', '<u2'),
+            ('seed_row', '<u2'),
+            ('mean_column', 'f4'),
+            ('mean_row', 'f4')])
+
+        clusters_fields = {
+            'eventNumber': 'event_number',
+            'ID': 'ID',
+            'size': 'n_hits',
+            'tot': 'charge',
+            'seed_column': 'seed_column',
+            'seed_row': 'seed_row',
+            'mean_column': 'mean_column',
+            'mean_row': 'mean_row'}
 
         # Initialize clusterizer and cluster test hits with self defined data type names
-        clusterizer = HitClusterizer(cluster_fields=cluster_fields, cluster_dtype=cluster_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        clusterizer = HitClusterizer(cluster_fields=clusters_fields, cluster_dtype=clusters_dtype, pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
         cluster_hits, clusters = clusterizer.cluster_hits(hits)
         array_size_before = clusterizer._clusters.shape[0]
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(4, ), dtype=cluster_dtype)
-        expected_cluster_result['eventNumber'] = [0, 1, 2, 3]
-        expected_cluster_result['size'] = [3, 3, 3, 1]
-        expected_cluster_result['tot'] = [1, 2, 1, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+        expected_clusters = np.zeros(shape=(4, ), dtype=clusters_dtype)
+        expected_clusters['eventNumber'] = [0, 1, 2, 3]
+        expected_clusters['size'] = [3, 3, 3, 1]
+        expected_clusters['tot'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
 
         # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-        expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Test same size array
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -497,8 +437,8 @@ def test_custom_cluster_fields(self):
 
         # Test results
         self.assertTrue(array_size_before == array_size_after)
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Test increasing size array
         hits = create_hits(n_hits=20, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -506,38 +446,30 @@ def test_custom_cluster_fields(self):
         array_size_after = clusterizer._clusters.shape[0]
 
         # Define expected output
-        expected_cluster_result = np.zeros(shape=(7, ), dtype=cluster_dtype)
-        expected_cluster_result['eventNumber'] = [0, 1, 2, 3, 4, 5, 6]
-        expected_cluster_result['size'] = [3, 3, 3, 3, 3, 3, 2]
-        expected_cluster_result['tot'] = [1, 2, 1, 2, 1, 2, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
+        expected_clusters = np.zeros(shape=(7, ), dtype=clusters_dtype)
+        expected_clusters['eventNumber'] = [0, 1, 2, 3, 4, 5, 6]
+        expected_clusters['size'] = [3, 3, 3, 3, 3, 3, 2]
+        expected_clusters['tot'] = [1, 2, 1, 2, 1, 2, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
+        expected_clusters['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
 
         # Define expected output. Cluster hit data types are different and thus the expected results have to have different data types
-        expected_hit_result = np.zeros(shape=(20, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(20, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
         self.assertTrue(array_size_before < array_size_after)
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_adding_cluster_field(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
@@ -550,46 +482,32 @@ def test_adding_cluster_field(self):
         array_size_before = clusterizer._clusters.shape[0]
 
         # Define expected cluster output with extra field
-        expected_cluster_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4'),
-                                                                        ('extra_field', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 1]
-        expected_cluster_result['charge'] = [1, 2, 1, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 10.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 19.0]
-        expected_cluster_result['extra_field'] = [0.0, 0.0, 0.0, 0.0]
+        modified_clusters_descr = default_clusters_descr[:]
+        modified_clusters_descr.append(('extra_field', 'f4'))
+        expected_clusters = np.zeros(shape=(4, ), dtype=np.dtype(modified_clusters_descr))
+        expected_clusters['event_number'] = [0, 1, 2, 3]
+        expected_clusters['n_hits'] = [3, 3, 3, 1]
+        expected_clusters['charge'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+        expected_clusters['extra_field'] = [0.0, 0.0, 0.0, 0.0]
 
         # Define expected hit clustered output
-        expected_hit_result = np.zeros(shape=(10, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Test same size array
         hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -598,8 +516,8 @@ def test_adding_cluster_field(self):
 
         # Test results
         self.assertTrue(array_size_before == array_size_after)
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Test increasing size array
         hits = create_hits(n_hits=20, max_column=100, max_row=100, max_frame=1, max_charge=2)
@@ -607,47 +525,33 @@ def test_adding_cluster_field(self):
         array_size_after = clusterizer._clusters.shape[0]
 
         # Define expected cluster output with extra field
-        expected_cluster_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', '<f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4'),
-                                                                        ('extra_field', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 1, 2, 3, 4, 5, 6]
-        expected_cluster_result['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
-        expected_cluster_result['charge'] = [1, 2, 1, 2, 1, 2, 1]
-        expected_cluster_result['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
-        expected_cluster_result['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
-        expected_cluster_result['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
-        expected_cluster_result['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
-        expected_cluster_result['extra_field'] = [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
+        modified_clusters_descr = default_clusters_descr[:]
+        modified_clusters_descr.append(('extra_field', 'f4'))
+        expected_clusters = np.zeros(shape=(7, ), dtype=np.dtype(modified_clusters_descr))
+        expected_clusters['event_number'] = [0, 1, 2, 3, 4, 5, 6]
+        expected_clusters['n_hits'] = [3, 3, 3, 3, 3, 3, 2]
+        expected_clusters['charge'] = [1, 2, 1, 2, 1, 2, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10, 14, 16, 20]
+        expected_clusters['seed_row'] = [3, 7, 15, 19, 27, 31, 39]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 11.0, 14.0, 17.0, (1 * 19 + 2 * 20) / 3.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 21.0, 27.0, 33.0, (1 * 37 + 2 * 39) / 3.0]
+        expected_clusters['extra_field'] = [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]
 
         # Define expected hit clustered output
-        expected_hit_result = np.zeros(shape=(20, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                     ('frame', '<u2'),
-                                                                     ('column', '<u2'),
-                                                                     ('row', '<u2'),
-                                                                     ('charge', '<f4'),
-                                                                     ('cluster_ID', '<i2'),
-                                                                     ('is_seed', '<u1'),
-                                                                     ('cluster_size', '<u2'),
-                                                                     ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
-        expected_hit_result['n_cluster'] = 1
+        expected_cluster_hits = np.zeros(shape=(20, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 2]
+        expected_cluster_hits['n_cluster'] = 1
 
         # Test results
         self.assertTrue(array_size_before < array_size_after)
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
 
 if __name__ == '__main__':
diff --git a/pixel_clusterizer/testing/test_hit_masking.py b/pixel_clusterizer/testing/test_hit_masking.py
index a0454ee..1d88f2a 100644
--- a/pixel_clusterizer/testing/test_hit_masking.py
+++ b/pixel_clusterizer/testing/test_hit_masking.py
@@ -8,10 +8,10 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hit_dtype
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hits_dtype, default_clusters_dtype, default_cluster_hits_dtype
 
 
-def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hit_dtype, hit_fields=None):
+def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hits_dtype, hit_fields=None):
     hits = np.zeros(shape=(n_hits, ), dtype=hit_dtype)
     if not hit_fields:
         for i in range(n_hits):
@@ -31,7 +31,7 @@ def setUpClass(cls):
 
     def test_disabled_pixels(self):
         # Create some fake data
-        hits = np.ones(shape=(7, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(7, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'], hits[0]['frame'] = 1, 2, 4, 0, 0
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'], hits[1]['frame'] = 2, 2, 4, 0, 0
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'], hits[2]['frame'] = 2, 2, 5, 1, 10
@@ -47,49 +47,34 @@ def test_disabled_pixels(self):
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[2, 2], [3, 3]])  # cluster hits
 
         # Check cluster
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 2]
-        expected_cluster_result['ID'] = [0, 0]
-        expected_cluster_result['n_hits'] = [1, 1]
-        expected_cluster_result['charge'] = [4, 6]
-        expected_cluster_result['seed_column'] = [1, 2]
-        expected_cluster_result['seed_row'] = [2, 3]
-        expected_cluster_result['mean_column'] = [1.0, 2.0]
-        expected_cluster_result['mean_row'] = [2.0, 3.0]
-
-        expected_hit_result = np.zeros(shape=(7, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, -1, -1, -1, 0, -1, -1]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 1, 0, 0]
-        expected_hit_result['cluster_size'] = [1, 0, 0, 0, 1, 0, 0]
-        expected_hit_result['n_cluster'] = [1, 1, 0, 1, 1, 1, 0]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 2]
+        expected_clusters['ID'] = [0, 0]
+        expected_clusters['n_hits'] = [1, 1]
+        expected_clusters['charge'] = [4, 6]
+        expected_clusters['seed_column'] = [1, 2]
+        expected_clusters['seed_row'] = [2, 3]
+        expected_clusters['mean_column'] = [1.0, 2.0]
+        expected_clusters['mean_row'] = [2.0, 3.0]
+
+        expected_cluster_hits = np.zeros(shape=(7, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, -1, -1, -1, 0, -1, -1]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 1, 0, 0]
+        expected_cluster_hits['cluster_size'] = [1, 0, 0, 0, 1, 0, 0]
+        expected_cluster_hits['n_cluster'] = [1, 1, 0, 1, 1, 1, 0]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_noisy_pixels(self):
         # Create some fake data
-        hits = np.ones(shape=(9, ), dtype=default_hit_dtype)
+        hits = np.ones(shape=(9, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['event_number'], hits[0]['frame'] = 1, 2, 8, 0, 0
         hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['event_number'], hits[1]['frame'] = 2, 2, 4, 0, 0
         hits[2]['column'], hits[2]['row'], hits[2]['charge'], hits[2]['event_number'], hits[2]['frame'] = 2, 2, 5, 1, 10
@@ -107,97 +92,67 @@ def test_noisy_pixels(self):
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[2, 2], [3, 3], [3, 15]])  # cluster hits
 
         # Check cluster
-        expected_cluster_result = np.zeros(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 2, 5]
-        expected_cluster_result['ID'] = [0, 0, 0]
-        expected_cluster_result['n_hits'] = [2, 3, 1]
-        expected_cluster_result['charge'] = [8 + 4, 12 + 6 + 3, 1]
-        expected_cluster_result['seed_column'] = [1, 2, 20]
-        expected_cluster_result['seed_row'] = [2, 2, 15]
-        expected_cluster_result['mean_column'] = [(9 * 1 + 5 * 2) / float(9 + 5), (13 * 2 + 7 * 2 + 4 * 3) / float(13 + 7 + 4), 20]
-        expected_cluster_result['mean_row'] = [(9 * 2 + 5 * 2) / float(9 + 5), (13 * 2 + 7 * 3 + 4 * 3) / float(13 + 7 + 4), 15]
-
-        expected_hit_result = np.zeros(shape=(9, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, -1, 0, 0, 0, -1, -1, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0, 1, 0, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 0, 3, 3, 3, 0, 0, 1]
-        expected_hit_result['n_cluster'] = [1, 1, 0, 1, 1, 1, 0, 0, 1]
+        expected_clusters = np.zeros(shape=(3, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 2, 5]
+        expected_clusters['ID'] = [0, 0, 0]
+        expected_clusters['n_hits'] = [2, 3, 1]
+        expected_clusters['charge'] = [8 + 4, 12 + 6 + 3, 1]
+        expected_clusters['seed_column'] = [1, 2, 20]
+        expected_clusters['seed_row'] = [2, 2, 15]
+        expected_clusters['mean_column'] = [(9 * 1 + 5 * 2) / float(9 + 5), (13 * 2 + 7 * 2 + 4 * 3) / float(13 + 7 + 4), 20]
+        expected_clusters['mean_row'] = [(9 * 2 + 5 * 2) / float(9 + 5), (13 * 2 + 7 * 3 + 4 * 3) / float(13 + 7 + 4), 15]
+
+        expected_cluster_hits = np.zeros(shape=(9, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, -1, 0, 0, 0, -1, -1, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 1, 0, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 0, 3, 3, 3, 0, 0, 1]
+        expected_cluster_hits['n_cluster'] = [1, 1, 0, 1, 1, 1, 0, 0, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
     def test_noisy_and_disabled_pixels(self):
         # Create single hit data
-        hits = np.zeros(shape=(1, ), dtype=default_hit_dtype)
+        hits = np.zeros(shape=(1, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
 
         # Case 1: Test single noisy pixel
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 1]])
 
-        expected_cluster_result = np.zeros(shape=(0, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-
-        expected_hit_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [-1]
-        expected_hit_result['is_seed'] = [0]
-        expected_hit_result['cluster_size'] = [0]
-        expected_hit_result['n_cluster'] = [0]
+        expected_clusters = np.zeros(shape=(0, ), dtype=default_clusters_dtype)
+
+        expected_cluster_hits = np.zeros(shape=(1, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [-1]
+        expected_cluster_hits['is_seed'] = [0]
+        expected_cluster_hits['cluster_size'] = [0]
+        expected_cluster_hits['n_cluster'] = [0]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 2: Test single disabled pixel
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 1]])
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Create double hit data
-        hits = np.zeros(shape=(2, ), dtype=default_hit_dtype)
+        hits = np.zeros(shape=(2, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
 
@@ -205,92 +160,62 @@ def test_noisy_and_disabled_pixels(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 1], [1, 2]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [2]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [1]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [1.5]
-
-        expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0]
-        expected_hit_result['is_seed'] = [1, 0]
-        expected_hit_result['cluster_size'] = [2, 2]
-        expected_hit_result['n_cluster'] = [1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [2]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [1]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [1.5]
+
+        expected_cluster_hits = np.zeros(shape=(2, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0]
+        expected_cluster_hits['is_seed'] = [1, 0]
+        expected_cluster_hits['cluster_size'] = [2, 2]
+        expected_cluster_hits['n_cluster'] = [1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 4: Test double noisy pixel
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 1], [1, 2]])
 
-        expected_cluster_result = np.zeros(shape=(0, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-
-        expected_hit_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [-1, -1]
-        expected_hit_result['is_seed'] = [0, 0]
-        expected_hit_result['cluster_size'] = [0, 0]
-        expected_hit_result['n_cluster'] = [0, 0]
+        expected_clusters = np.zeros(shape=(0, ), dtype=default_clusters_dtype)
+
+        expected_cluster_hits = np.zeros(shape=(2, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [-1, -1]
+        expected_cluster_hits['is_seed'] = [0, 0]
+        expected_cluster_hits['cluster_size'] = [0, 0]
+        expected_cluster_hits['n_cluster'] = [0, 0]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 5: Test noisy and disabled pixel
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 1]], disabled_pixels=[[1, 2]])
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Create triple hit data
-        hits = np.zeros(shape=(3, ), dtype=default_hit_dtype)
+        hits = np.zeros(shape=(3, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -299,48 +224,33 @@ def test_noisy_and_disabled_pixels(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 1]], noisy_pixels=[[1, 2], [1, 3]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [2]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [2]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [2.5]
-
-        expected_hit_result = np.zeros(shape=(3, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [-1, 0, 0]
-        expected_hit_result['is_seed'] = [0, 1, 0]
-        expected_hit_result['cluster_size'] = [0, 2, 2]
-        expected_hit_result['n_cluster'] = [1, 1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [2]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [2]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [2.5]
+
+        expected_cluster_hits = np.zeros(shape=(3, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [-1, 0, 0]
+        expected_cluster_hits['is_seed'] = [0, 1, 0]
+        expected_cluster_hits['cluster_size'] = [0, 2, 2]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Create quadruple hit data
-        hits = np.zeros(shape=(4, ), dtype=default_hit_dtype)
+        hits = np.zeros(shape=(4, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -350,92 +260,62 @@ def test_noisy_and_disabled_pixels(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3]])
 
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 0]
-        expected_cluster_result['ID'] = [0, 1]
-        expected_cluster_result['n_hits'] = [2, 1]
-        expected_cluster_result['charge'] = [0, 0]
-        expected_cluster_result['seed_column'] = [1, 1]
-        expected_cluster_result['seed_row'] = [1, 4]
-        expected_cluster_result['mean_column'] = [1.0, 1.0]
-        expected_cluster_result['mean_row'] = [1.5, 4.0]
-
-        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, -1, 1]
-        expected_hit_result['is_seed'] = [1, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 0, 1]
-        expected_hit_result['n_cluster'] = [2, 2, 2, 2]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 0]
+        expected_clusters['ID'] = [0, 1]
+        expected_clusters['n_hits'] = [2, 1]
+        expected_clusters['charge'] = [0, 0]
+        expected_clusters['seed_column'] = [1, 1]
+        expected_clusters['seed_row'] = [1, 4]
+        expected_clusters['mean_column'] = [1.0, 1.0]
+        expected_clusters['mean_row'] = [1.5, 4.0]
+
+        expected_cluster_hits = np.zeros(shape=(4, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, -1, 1]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 0, 1]
+        expected_cluster_hits['n_cluster'] = [2, 2, 2, 2]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 8: Test quadruple pixel with single noisy pixel
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [4]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [1]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [2.5]
-
-        expected_hit_result = np.zeros(shape=(4, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 0, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0]
-        expected_hit_result['cluster_size'] = [4, 4, 4, 4]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [4]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [1]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [2.5]
+
+        expected_cluster_hits = np.zeros(shape=(4, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0]
+        expected_cluster_hits['cluster_size'] = [4, 4, 4, 4]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Create quintuple hit data
-        hits = np.zeros(shape=(5, ), dtype=default_hit_dtype)
+        hits = np.zeros(shape=(5, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -446,180 +326,120 @@ def test_noisy_and_disabled_pixels(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3], [1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 0]
-        expected_cluster_result['ID'] = [0, 1]
-        expected_cluster_result['n_hits'] = [2, 1]
-        expected_cluster_result['charge'] = [0, 0]
-        expected_cluster_result['seed_column'] = [1, 1]
-        expected_cluster_result['seed_row'] = [1, 5]
-        expected_cluster_result['mean_column'] = [1.0, 1.0]
-        expected_cluster_result['mean_row'] = [1.5, 5.0]
-
-        expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, -1, -1, 1]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 0, 0, 1]
-        expected_hit_result['n_cluster'] = [2, 2, 2, 2, 2]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 0]
+        expected_clusters['ID'] = [0, 1]
+        expected_clusters['n_hits'] = [2, 1]
+        expected_clusters['charge'] = [0, 0]
+        expected_clusters['seed_column'] = [1, 1]
+        expected_clusters['seed_row'] = [1, 5]
+        expected_clusters['mean_column'] = [1.0, 1.0]
+        expected_clusters['mean_row'] = [1.5, 5.0]
+
+        expected_cluster_hits = np.zeros(shape=(5, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, -1, -1, 1]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 0, 0, 1]
+        expected_cluster_hits['n_cluster'] = [2, 2, 2, 2, 2]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 10: Test quintuple pixel with 2 noisy pixel
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [5]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [1]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [3.0]
-
-        expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 0, 0, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 0]
-        expected_hit_result['cluster_size'] = [5, 5, 5, 5, 5]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [5]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [1]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [3.0]
+
+        expected_cluster_hits = np.zeros(shape=(5, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0, 0, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 0]
+        expected_cluster_hits['cluster_size'] = [5, 5, 5, 5, 5]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 11: Test quintuple pixel with single noisy and disabled pixels
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]], disabled_pixels=[[1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 0]
-        expected_cluster_result['ID'] = [0, 1]
-        expected_cluster_result['n_hits'] = [3, 1]
-        expected_cluster_result['charge'] = [0, 0]
-        expected_cluster_result['seed_column'] = [1, 1]
-        expected_cluster_result['seed_row'] = [1, 5]
-        expected_cluster_result['mean_column'] = [1.0, 1.0]
-        expected_cluster_result['mean_row'] = [2.0, 5.0]
-
-        expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 0, -1, 1]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 0, 1]
-        expected_hit_result['n_cluster'] = [2, 2, 2, 2, 2]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 0]
+        expected_clusters['ID'] = [0, 1]
+        expected_clusters['n_hits'] = [3, 1]
+        expected_clusters['charge'] = [0, 0]
+        expected_clusters['seed_column'] = [1, 1]
+        expected_clusters['seed_row'] = [1, 5]
+        expected_clusters['mean_column'] = [1.0, 1.0]
+        expected_clusters['mean_row'] = [2.0, 5.0]
+
+        expected_cluster_hits = np.zeros(shape=(5, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0, -1, 1]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 0, 1]
+        expected_cluster_hits['n_cluster'] = [2, 2, 2, 2, 2]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 12: Test quintuple pixel with single noisy and disabled pixels
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3]], disabled_pixels=[[1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [4]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [1]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [2.75]
-
-        expected_hit_result = np.zeros(shape=(5, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 0, -1, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 0]
-        expected_hit_result['cluster_size'] = [4, 4, 4, 0, 4]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [4]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [1]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [2.75]
+
+        expected_cluster_hits = np.zeros(shape=(5, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0, -1, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 0]
+        expected_cluster_hits['cluster_size'] = [4, 4, 4, 0, 4]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Create sextuple hit data
-        hits = np.zeros(shape=(6, ), dtype=default_hit_dtype)
+        hits = np.zeros(shape=(6, ), dtype=default_hits_dtype)
         hits[0]['column'], hits[0]['row'] = 1, 1
         hits[1]['column'], hits[1]['row'] = 1, 2
         hits[2]['column'], hits[2]['row'] = 1, 3
@@ -631,177 +451,117 @@ def test_noisy_and_disabled_pixels(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3], [1, 5]], disabled_pixels=[[1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 0]
-        expected_cluster_result['ID'] = [0, 1]
-        expected_cluster_result['n_hits'] = [3, 2]
-        expected_cluster_result['charge'] = [0, 0]
-        expected_cluster_result['seed_column'] = [1, 1]
-        expected_cluster_result['seed_row'] = [1, 5]
-        expected_cluster_result['mean_column'] = [1.0, 1.0]
-        expected_cluster_result['mean_row'] = [2.0, 5.5]
-
-        expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 0, -1, 1, 1]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 1, 0]
-        expected_hit_result['cluster_size'] = [3, 3, 3, 0, 2, 2]
-        expected_hit_result['n_cluster'] = [2, 2, 2, 2, 2, 2]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 0]
+        expected_clusters['ID'] = [0, 1]
+        expected_clusters['n_hits'] = [3, 2]
+        expected_clusters['charge'] = [0, 0]
+        expected_clusters['seed_column'] = [1, 1]
+        expected_clusters['seed_row'] = [1, 5]
+        expected_clusters['mean_column'] = [1.0, 1.0]
+        expected_clusters['mean_row'] = [2.0, 5.5]
+
+        expected_cluster_hits = np.zeros(shape=(6, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0, -1, 1, 1]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 1, 0]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 0, 2, 2]
+        expected_cluster_hits['n_cluster'] = [2, 2, 2, 2, 2, 2]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 14: Test sextuple pixel with noisy and disabled pixels
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, noisy_pixels=[[1, 3], [1, 5]], disabled_pixels=[[1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [5]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [1]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [3.4]
-
-        expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, 0, -1, 0, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 0, 0]
-        expected_hit_result['cluster_size'] = [5, 5, 5, 0, 5, 5]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1, 1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [5]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [1]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [3.4]
+
+        expected_cluster_hits = np.zeros(shape=(6, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, 0, -1, 0, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 0, 0]
+        expected_cluster_hits['cluster_size'] = [5, 5, 5, 0, 5, 5]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 15: Test sextuple pixel with noisy and disabled pixels
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=1, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3], [1, 5]], noisy_pixels=[[1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(2, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0, 0]
-        expected_cluster_result['ID'] = [0, 1]
-        expected_cluster_result['n_hits'] = [2, 1]
-        expected_cluster_result['charge'] = [0, 0]
-        expected_cluster_result['seed_column'] = [1, 1]
-        expected_cluster_result['seed_row'] = [1, 6]
-        expected_cluster_result['mean_column'] = [1.0, 1.0]
-        expected_cluster_result['mean_row'] = [1.5, 6.0]
-
-        expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, -1, -1, -1, 1]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 0, 1]
-        expected_hit_result['cluster_size'] = [2, 2, 0, 0, 0, 1]
-        expected_hit_result['n_cluster'] = [2, 2, 2, 2, 2, 2]
+        expected_clusters = np.zeros(shape=(2, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 0]
+        expected_clusters['ID'] = [0, 1]
+        expected_clusters['n_hits'] = [2, 1]
+        expected_clusters['charge'] = [0, 0]
+        expected_clusters['seed_column'] = [1, 1]
+        expected_clusters['seed_row'] = [1, 6]
+        expected_clusters['mean_column'] = [1.0, 1.0]
+        expected_clusters['mean_row'] = [1.5, 6.0]
+
+        expected_cluster_hits = np.zeros(shape=(6, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, -1, -1, -1, 1]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 0, 1]
+        expected_cluster_hits['cluster_size'] = [2, 2, 0, 0, 0, 1]
+        expected_cluster_hits['n_cluster'] = [2, 2, 2, 2, 2, 2]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
         # Case 16: Test sextuple pixel with noisy and disabled pixels
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=1, row_cluster_distance=2, frame_cluster_distance=1, ignore_same_hits=True)
         cluster_hits, clusters = clusterizer.cluster_hits(hits, disabled_pixels=[[1, 3], [1, 5]], noisy_pixels=[[1, 4]])
 
-        expected_cluster_result = np.zeros(shape=(1, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                        ('ID', '<u2'),
-                                                                        ('n_hits', '<u2'),
-                                                                        ('charge', 'f4'),
-                                                                        ('seed_column', '<u2'),
-                                                                        ('seed_row', '<u2'),
-                                                                        ('mean_column', 'f4'),
-                                                                        ('mean_row', 'f4')]))
-        expected_cluster_result['event_number'] = [0]
-        expected_cluster_result['ID'] = [0]
-        expected_cluster_result['n_hits'] = [4]
-        expected_cluster_result['charge'] = [0]
-        expected_cluster_result['seed_column'] = [1]
-        expected_cluster_result['seed_row'] = [1]
-        expected_cluster_result['mean_column'] = [1.0]
-        expected_cluster_result['mean_row'] = [3.25]
-
-        expected_hit_result = np.zeros(shape=(6, ), dtype=np.dtype([('event_number', '<i8'),
-                                                                    ('frame', '<u2'),
-                                                                    ('column', '<u2'),
-                                                                    ('row', '<u2'),
-                                                                    ('charge', '<f4'),
-                                                                    ('cluster_ID', '<i2'),
-                                                                    ('is_seed', '<u1'),
-                                                                    ('cluster_size', '<u2'),
-                                                                    ('n_cluster', '<u2')]))
-        expected_hit_result['event_number'] = hits['event_number']
-        expected_hit_result['frame'] = hits['frame']
-        expected_hit_result['column'] = hits['column']
-        expected_hit_result['row'] = hits['row']
-        expected_hit_result['charge'] = hits['charge']
-        expected_hit_result['cluster_ID'] = [0, 0, -1, 0, -1, 0]
-        expected_hit_result['is_seed'] = [1, 0, 0, 0, 0, 0]
-        expected_hit_result['cluster_size'] = [4, 4, 0, 4, 0, 4]
-        expected_hit_result['n_cluster'] = [1, 1, 1, 1, 1, 1]
+        expected_clusters = np.zeros(shape=(1, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0]
+        expected_clusters['ID'] = [0]
+        expected_clusters['n_hits'] = [4]
+        expected_clusters['charge'] = [0]
+        expected_clusters['seed_column'] = [1]
+        expected_clusters['seed_row'] = [1]
+        expected_clusters['mean_column'] = [1.0]
+        expected_clusters['mean_row'] = [3.25]
+
+        expected_cluster_hits = np.zeros(shape=(6, ), dtype=default_cluster_hits_dtype)
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['cluster_ID'] = [0, 0, -1, 0, -1, 0]
+        expected_cluster_hits['is_seed'] = [1, 0, 0, 0, 0, 0]
+        expected_cluster_hits['cluster_size'] = [4, 4, 0, 4, 0, 4]
+        expected_cluster_hits['n_cluster'] = [1, 1, 1, 1, 1, 1]
 
         # Test results
-        self.assertTrue(np.array_equal(clusters, expected_cluster_result))
-        self.assertTrue(np.array_equal(cluster_hits, expected_hit_result))
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
 
 if __name__ == '__main__':

From 70f42a7c05eb5d9b89a92a3bd0f3db10ff8e1d27 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 13:42:45 +0200
Subject: [PATCH 24/28] ENH: additional sanity checks for the event_number
 column

---
 pixel_clusterizer/clusterizer.py              | 16 +++++++++-------
 pixel_clusterizer/testing/test_clusterizer.py |  6 ++++++
 2 files changed, 15 insertions(+), 7 deletions(-)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index b435581..697b9d2 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -361,6 +361,14 @@ def cluster_hits(self, hits, noisy_pixels=None, disabled_pixels=None):
             if cluster_hits_field_name in self._cluster_hits.dtype.fields:
                 self._cluster_hits[cluster_hits_field_name][:n_hits] = hits[field_name]
 
+        # Check if event number is increasing. Otherwise give a warning message.
+        if self._last_event_number is not None and hits.shape[0] != 0 and self._cluster_hits["event_number"][0] <= self._last_event_number:
+            logging.warning('The event number does not increase with successive chunks.')
+        if hits.shape[0] > 1 and not np.all((self._cluster_hits["event_number"][1:n_hits] - self._cluster_hits["event_number"][:n_hits - 1]) >= 0):
+            raise RuntimeError('Some values in column "%s" decrease.' % (self._hit_fields_mapping["event_number"],))
+        if self._cluster_hits.shape[0] != 0:
+            self._last_event_number = self._cluster_hits[-1]["event_number"]
+
         noisy_pixels_array = np.array([]) if noisy_pixels is None else np.array(noisy_pixels)
         if noisy_pixels_array.shape[0] != 0:
             noisy_pixels_max_range = np.array([max(0, np.max(noisy_pixels_array[:, 0])), max(0, np.max(noisy_pixels_array[:, 1]))])
@@ -386,12 +394,6 @@ def cluster_hits(self, hits, noisy_pixels=None, disabled_pixels=None):
 #         disabled_pixels = np.recarray(disabled_pixels_array.shape[0], dtype=mask_dtype)
 #         disabled_pixels[:] = [(item[0], item[1]) for item in disabled_pixels_array]
 
-        # Check if event number is increasing. Otherwise give a warning message.
-        if self._last_event_number is not None and self._cluster_hits.shape[0] != 0 and self._cluster_hits[0]["event_number"] == self._last_event_number:
-            logging.warning('Event number not increasing.')
-        if self._cluster_hits.shape[0] != 0:
-            self._last_event_number = self._cluster_hits[-1]["event_number"]
-
         n_clusters = self.cluster_functions._cluster_hits(  # Set n_clusters to new size
             hits=self._cluster_hits[:n_hits],
             clusters=self._clusters[:n_hits],
@@ -474,4 +476,4 @@ def _check_struct_compatibility(self, hits):
                 raise TypeError('The dtype for hit data field "%s" does not match. Got/expected: %s/%s.' % (key, hits.dtype[key], self._cluster_hits.dtype[mapped_key]))
         additional_hit_fields = set(hits.dtype.names) - set([key for key, val in self._cluster_hits_descr])
         if additional_hit_fields:
-            logging.warning('Found additional hit fields: %s' % ", ".join(additional_hit_fields))
+            logging.warning('Found additional column: %s' % ", ".join(additional_hit_fields))
diff --git a/pixel_clusterizer/testing/test_clusterizer.py b/pixel_clusterizer/testing/test_clusterizer.py
index 68638b3..94b2c09 100644
--- a/pixel_clusterizer/testing/test_clusterizer.py
+++ b/pixel_clusterizer/testing/test_clusterizer.py
@@ -63,6 +63,12 @@ def test_exceptions(self):
             'frame': 'frame'}
         clusterizer = HitClusterizer(hit_fields=hit_mapping, hit_dtype=hit_dtype_new, pure_python=self.pure_python)
         _, _ = clusterizer.cluster_hits(np.array([], dtype=hit_dtype_new))
+        # TEST 4 Set custom and correct hit mapping, decrease event_number
+        hits = np.ones(shape=(2, ), dtype=hit_dtype_new)
+        hits[0]['column'], hits[0]['row'], hits[0]['charge'], hits[0]['not_defined'] = 17, 36, 30, 19
+        hits[1]['column'], hits[1]['row'], hits[1]['charge'], hits[1]['not_defined'] = 18, 36, 6, 18
+        with self.assertRaises(RuntimeError):
+            _, _ = clusterizer.cluster_hits(hits)
 
     def test_cluster_algorithm(self):  # Basic functionality checks
         # Initialize Clusterizer with default arguments

From 0b67b3de5d6a4219d3ca32bf056b39e9d9898190 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 14:38:09 +0200
Subject: [PATCH 25/28] ENH: adding function to add hit field

---
 pixel_clusterizer/clusterizer.py             | 29 +++++++++----
 pixel_clusterizer/testing/test_data_types.py | 44 +++++++++++++++++++-
 2 files changed, 64 insertions(+), 9 deletions(-)

diff --git a/pixel_clusterizer/clusterizer.py b/pixel_clusterizer/clusterizer.py
index 697b9d2..d1a3e8c 100644
--- a/pixel_clusterizer/clusterizer.py
+++ b/pixel_clusterizer/clusterizer.py
@@ -119,7 +119,7 @@ def initialized(self):
     def _init_arrays(self, size=0):
         if self.initialized:
             self._cluster_hits = np.zeros(shape=(size, ), dtype=np.dtype(self._cluster_hits_descr))
-            self._clusters = np.zeros(shape=(size, ), dtype=np.dtype(self._cluster_descr))
+            self._clusters = np.zeros(shape=(size, ), dtype=np.dtype(self._clusters_descr))
             self._assigned_hit_array = np.zeros(shape=(size, ), dtype=np.bool)
             self._cluster_hit_indices = np.full(shape=(size, ), fill_value=-1, dtype=np_int_type_chooser(size))
 
@@ -228,13 +228,26 @@ def set_cluster_dtype(self, cluster_dtype):
             cluster_dtype = np.dtype([])
         else:
             cluster_dtype = np.dtype(cluster_dtype)
-        cluster_descr = cluster_dtype.descr
+        clusters_descr = cluster_dtype.descr
 
         for dtype_name, dtype in self._default_clusters_descr:
             if self._cluster_fields_mapping[dtype_name] not in cluster_dtype.fields:
-                cluster_descr.append((dtype_name, dtype))
+                clusters_descr.append((dtype_name, dtype))
 
-        self._cluster_descr = cluster_descr
+        self._clusters_descr = clusters_descr
+        self._init_arrays(size=0)
+
+    def add_hit_field(self, description):
+        ''' Adds a field or a list of fields to the cluster result array. Has to be defined as a numpy dtype entry, e.g.: ('parameter', '<i4') '''
+        if isinstance(description, list):
+            for item in description:
+                if len(item) != 2:
+                    raise TypeError("Parameter description must be a list of 2-tuples of a string and a dtype.")
+                self._cluster_hits_descr.append(item)
+        else:
+            if len(description) != 2:
+                raise TypeError("Parameter description must be a 2-tuple of a string and a dtype.")
+            self._cluster_hits_descr.append(description)
         self._init_arrays(size=0)
 
     def add_cluster_field(self, description):
@@ -242,12 +255,12 @@ def add_cluster_field(self, description):
         if isinstance(description, list):
             for item in description:
                 if len(item) != 2:
-                    raise TypeError("Description needs to be a list of 2-tuples of a string and a dtype.")
-                self._cluster_descr.append(item)
+                    raise TypeError("Parameter description must be a list of 2-tuples of a string and a dtype.")
+                self._clusters_descr.append(item)
         else:
             if len(description) != 2:
-                raise TypeError("Description needs to be a 2-tuple of a string and a dtype.")
-            self._cluster_descr.append(description)
+                raise TypeError("Parameter description must be a 2-tuple of a string and a dtype.")
+            self._clusters_descr.append(description)
         self._init_arrays(size=0)
 
     def set_end_of_cluster_function(self, function):
diff --git a/pixel_clusterizer/testing/test_data_types.py b/pixel_clusterizer/testing/test_data_types.py
index 652d9e5..7fb6229 100644
--- a/pixel_clusterizer/testing/test_data_types.py
+++ b/pixel_clusterizer/testing/test_data_types.py
@@ -6,7 +6,7 @@
 
 import numpy as np
 
-from pixel_clusterizer.clusterizer import HitClusterizer, default_hits_dtype, default_clusters_dtype, default_clusters_descr, default_cluster_hits_dtype
+from pixel_clusterizer.clusterizer import HitClusterizer, default_hits_descr, default_hits_dtype, default_clusters_dtype, default_clusters_descr, default_cluster_hits_descr, default_cluster_hits_dtype
 
 
 def create_hits(n_hits, max_column, max_row, max_frame, max_charge, hit_dtype=default_hits_dtype, hit_fields=None):
@@ -471,6 +471,48 @@ def test_custom_cluster_fields(self):
         self.assertTrue(np.array_equal(clusters, expected_clusters))
         self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
 
+    def test_adding_hit_field(self):
+        clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
+        with self.assertRaises(TypeError):
+            clusterizer.add_hit_field(description=['extra_field', 'f4'])  # also test list of 2 items
+        clusterizer.add_hit_field(description=[('extra_field', 'f4')])  # also test list of 2-tuples
+        modified_hits_descr = default_hits_descr[:]
+        modified_hits_descr.append(('extra_field', 'f4'))
+        hits = create_hits(n_hits=10, max_column=100, max_row=100, max_frame=1, max_charge=2, hit_dtype=np.dtype(modified_hits_descr))
+        hits['extra_field'][1:] = range(hits.shape[0] - 1)
+        cluster_hits, clusters = clusterizer.cluster_hits(hits)
+
+        # Define expected cluster output with extra field
+        expected_clusters = np.zeros(shape=(4, ), dtype=default_clusters_dtype)
+        expected_clusters['event_number'] = [0, 1, 2, 3]
+        expected_clusters['n_hits'] = [3, 3, 3, 1]
+        expected_clusters['charge'] = [1, 2, 1, 1]
+        expected_clusters['seed_column'] = [2, 4, 8, 10]
+        expected_clusters['seed_row'] = [3, 7, 15, 19]
+        expected_clusters['mean_column'] = [2.0, 5.0, 8.0, 10.0]
+        expected_clusters['mean_row'] = [3.0, 9.0, 15.0, 19.0]
+
+        # Define expected hit clustered output
+        modified_cluster_hits_descr = default_cluster_hits_descr[:]
+        modified_cluster_hits_descr.append(('extra_field', 'f4'))
+        expected_cluster_hits = np.zeros(shape=(10, ), dtype=np.dtype(modified_cluster_hits_descr))
+        expected_cluster_hits['event_number'] = hits['event_number']
+        expected_cluster_hits['frame'] = hits['frame']
+        expected_cluster_hits['column'] = hits['column']
+        expected_cluster_hits['row'] = hits['row']
+        expected_cluster_hits['charge'] = hits['charge']
+        expected_cluster_hits['is_seed'] = [0, 1, 0, 1, 0, 0, 0, 1, 0, 1]
+        expected_cluster_hits['cluster_size'] = [3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
+        expected_cluster_hits['n_cluster'] = 1
+        expected_cluster_hits['extra_field'] = [0.0, 0.0, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0]
+
+        # Test results
+        print("\n")
+        print(clusters)
+        print(expected_clusters)
+        self.assertTrue(np.array_equal(clusters, expected_clusters))
+        self.assertTrue(np.array_equal(cluster_hits, expected_cluster_hits))
+
     def test_adding_cluster_field(self):
         clusterizer = HitClusterizer(pure_python=self.pure_python, min_hit_charge=0, max_hit_charge=13, charge_correction=1, charge_weighted_clustering=True, column_cluster_distance=2, row_cluster_distance=2, frame_cluster_distance=4, ignore_same_hits=True)
         with self.assertRaises(TypeError):

From 41912cab8e79598e889dcebb1b037747947c25ed Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 14:41:01 +0200
Subject: [PATCH 26/28] MAINT: update description and set python_requires
 parameter

---
 setup.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/setup.py b/setup.py
index fcfaf05..1f15d8c 100644
--- a/setup.py
+++ b/setup.py
@@ -12,7 +12,7 @@
 setup(
     name='pixel_clusterizer',
     version=version,
-    description='A fast, generic, and easy to use clusterizer to cluster hits of a pixel matrix in Python. The clustering happens with numba on numpy arrays to increase the speed.',
+    description='A fast, generic, and easy to use clusterizer to cluster hits of a pixel matrix in Python.',
     url='https://github.com/SiLab-Bonn/pixel_clusterizer',
     license='GNU LESSER GENERAL PUBLIC LICENSE Version 2.1',
     long_description='',
@@ -25,5 +25,6 @@
     include_package_data=True,  # accept all data files and directories matched by MANIFEST.in or found in source control
     package_data={'': ['README.*', 'VERSION'], 'docs': ['*'], 'examples': ['*']},
     keywords=['cluster', 'clusterizer', 'pixel'],
+    python_requires='>=2.7',
     platforms='any'
 )

From fb632eeff7fcbe2f29ddd3902a3e01cc96e2c01e Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 14:41:23 +0200
Subject: [PATCH 27/28] PRJ: bump version to 3.1.5

---
 setup.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/setup.py b/setup.py
index 1f15d8c..19e45ff 100644
--- a/setup.py
+++ b/setup.py
@@ -1,7 +1,7 @@
 #!/usr/bin/env python
 from setuptools import setup, find_packages  # This setup relies on setuptools since distutils is insufficient and badly hacked code
 
-version = '3.1.5.dev0'
+version = '3.1.5'
 author = 'David-Leon Pohl, Jens Janssen'
 author_email = 'pohl@physik.uni-bonn.de, janssen@physik.uni-bonn.de'
 

From a66b7d3b89c5249e224e3e24ea2e978599124da5 Mon Sep 17 00:00:00 2001
From: Jens Janssen <janssen@physik.uni-bonn.de>
Date: Tue, 24 Sep 2019 14:46:34 +0200
Subject: [PATCH 28/28] MAINT: update README

---
 README.md | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/README.md b/README.md
index a458e36..b01f02b 100644
--- a/README.md
+++ b/README.md
@@ -72,3 +72,7 @@ cluster_hits, clusters = cr.cluster_hits(hits)  # Cluster hits
 
 ```
 Also please have a look at the ```examples``` folder!
+
+## Support
+
+Please use GitHub's [issue tracker](https://github.com/SiLab-Bonn/pixel_clusterizer/issues) for bug reports/feature requests/questions.