Merge pull request #4519 from broadinstitute/dev

Dev
broadinstitute · Dec 5, 2024 · f59d904 · f59d904
2 parents ef13b05 + 5d48616
commit f59d904
Show file tree

Hide file tree

Showing 179 changed files with 1,084 additions and 1,587 deletions.
diff --git a/.github/workflows/local-install-tests.yml b/.github/workflows/local-install-tests.yml
@@ -13,4 +13,7 @@ jobs:
     steps:
       - uses: actions/checkout@v2
       - name: Run test_local_deployment script
-        run: ./test_local_deployment.sh
+        run: |
+          mkdir ./data
+          chmod 777 ./data
+          ./test_local_deployment.sh
diff --git a/deploy/LOCAL_INSTALL.md b/deploy/LOCAL_INSTALL.md
@@ -30,6 +30,8 @@ The steps below describe how to create a new empty seqr instance with a single A
 SEQR_DIR=$(pwd)
 
 wget https://raw.githubusercontent.com/broadinstitute/seqr/master/docker-compose.yml
+wget https://raw.githubusercontent.com/broadinstitute/seqr/master/deploy/postgres/initdb.sql
+mv initdb.sql ./data/postgres_init/initdb.sql
 
 docker compose up -d seqr   # start up the seqr docker image in the background after also starting other components it depends on (postgres, redis, elasticsearch). This may take 10+ minutes.
 docker compose logs -f seqr  # (optional) continuously print seqr logs to see when it is done starting up or if there are any errors. Type Ctrl-C to exit from the logs. 

diff --git a/docker-compose.yml b/docker-compose.yml
@@ -8,7 +8,7 @@ services:
       - PGPORT=5433
       - POSTGRES_PASSWORD=docker-compose-postgres-password
     volumes:
-      - ./deploy/postgres/initdb.sql:/docker-entrypoint-initdb.d/initdb.sql
+      - ./data/postgres_init/initdb.sql:/docker-entrypoint-initdb.d/initdb.sql
       - ./data/postgres:/var/lib/postgresql/data
     healthcheck:
       test: pg_isready -h postgres -U postgres

diff --git a/hail_search/constants.py b/hail_search/constants.py
@@ -19,7 +19,6 @@
 MOTIF_FEATURES_KEY = 'motif_feature'
 REGULATORY_FEATURES_KEY = 'regulatory_feature'
 CLINVAR_KEY = 'clinvar'
-CLINVAR_MITO_KEY = 'clinvar_mito'
 HGMD_KEY = 'hgmd'
 STRUCTURAL_ANNOTATION_FIELD = 'structural'
 FAMILY_GUID_FIELD = 'familyGuids'

diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/.README.txt.crc b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/.README.txt.crc
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/.metadata.json.gz.crc b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/README.txt b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/README.txt
@@ -1,3 +1,3 @@
 This folder comprises a Hail (www.hail.is) native Table or MatrixTable.
-  Written with version 0.2.128-eead8100a1c1
-  Created at 2024/06/10 16:51:30
+  Written with version 0.2.133-4c60fddb171a
+  Created at 2024/12/04 13:07:33
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/.metadata.json.gz.crc b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/metadata.json.gz b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/parts/.part-0.crc b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/parts/.part-0.crc
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/parts/part-0 b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/globals/parts/part-0
diff --git a/...97c-431c-95a6-6a49862ec937.idx/.index.crc → ...8dd-4b54-8db9-097b88a68456.idx/.index.crc b/...97c-431c-95a6-6a49862ec937.idx/.index.crc → ...8dd-4b54-8db9-097b88a68456.idx/.index.crc
diff --git a/...a6-6a49862ec937.idx/.metadata.json.gz.crc → ...b9-097b88a68456.idx/.metadata.json.gz.crc b/...a6-6a49862ec937.idx/.metadata.json.gz.crc → ...b9-097b88a68456.idx/.metadata.json.gz.crc
diff --git a/...b7d-c97c-431c-95a6-6a49862ec937.idx/index → ...149-c8dd-4b54-8db9-097b88a68456.idx/index b/...b7d-c97c-431c-95a6-6a49862ec937.idx/index → ...149-c8dd-4b54-8db9-097b88a68456.idx/index
diff --git a/...1c-95a6-6a49862ec937.idx/metadata.json.gz → ...54-8db9-097b88a68456.idx/metadata.json.gz b/...1c-95a6-6a49862ec937.idx/metadata.json.gz → ...54-8db9-097b88a68456.idx/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/metadata.json.gz b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/rows/.metadata.json.gz.crc b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/rows/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/rows/metadata.json.gz b/hail_search/fixtures/GRCh37/SNV_INDEL/annotations.ht/rows/metadata.json.gz
diff --git a/...Ch37/SNV_INDEL/annotations.ht/rows/parts/.part-0-32c79149-c8dd-4b54-8db9-097b88a68456.crc b/...Ch37/SNV_INDEL/annotations.ht/rows/parts/.part-0-32c79149-c8dd-4b54-8db9-097b88a68456.crc
diff --git a/...Ch37/SNV_INDEL/annotations.ht/rows/parts/.part-0-b51ceb7d-c97c-431c-95a6-6a49862ec937.crc b/...Ch37/SNV_INDEL/annotations.ht/rows/parts/.part-0-b51ceb7d-c97c-431c-95a6-6a49862ec937.crc
diff --git a/...es/GRCh37/SNV_INDEL/annotations.ht/rows/parts/part-0-32c79149-c8dd-4b54-8db9-097b88a68456 b/...es/GRCh37/SNV_INDEL/annotations.ht/rows/parts/part-0-32c79149-c8dd-4b54-8db9-097b88a68456
diff --git a/...es/GRCh37/SNV_INDEL/annotations.ht/rows/parts/part-0-b51ceb7d-c97c-431c-95a6-6a49862ec937 b/...es/GRCh37/SNV_INDEL/annotations.ht/rows/parts/part-0-b51ceb7d-c97c-431c-95a6-6a49862ec937
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/.README.txt.crc b/hail_search/fixtures/GRCh38/MITO/annotations.ht/.README.txt.crc
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/.metadata.json.gz.crc b/hail_search/fixtures/GRCh38/MITO/annotations.ht/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/README.txt b/hail_search/fixtures/GRCh38/MITO/annotations.ht/README.txt
@@ -1,3 +1,3 @@
 This folder comprises a Hail (www.hail.is) native Table or MatrixTable.
-  Written with version 0.2.128-eead8100a1c1
-  Created at 2024/10/14 16:14:00
+  Written with version 0.2.133-4c60fddb171a
+  Created at 2024/12/04 11:15:26
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/.metadata.json.gz.crc b/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/metadata.json.gz b/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/parts/.part-0.crc b/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/parts/.part-0.crc
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/parts/part-0 b/hail_search/fixtures/GRCh38/MITO/annotations.ht/globals/parts/part-0
diff --git a/...0a9-410f-b5fe-03749bbbd8db.idx/.index.crc → ...7bd-401a-a7e9-4cfbc473e5d4.idx/.index.crc b/...0a9-410f-b5fe-03749bbbd8db.idx/.index.crc → ...7bd-401a-a7e9-4cfbc473e5d4.idx/.index.crc
diff --git a/...fe-03749bbbd8db.idx/.metadata.json.gz.crc → ...e9-4cfbc473e5d4.idx/.metadata.json.gz.crc b/...fe-03749bbbd8db.idx/.metadata.json.gz.crc → ...e9-4cfbc473e5d4.idx/.metadata.json.gz.crc
diff --git a/...bd3-d0a9-410f-b5fe-03749bbbd8db.idx/index → ...c60-87bd-401a-a7e9-4cfbc473e5d4.idx/index b/...bd3-d0a9-410f-b5fe-03749bbbd8db.idx/index → ...c60-87bd-401a-a7e9-4cfbc473e5d4.idx/index
diff --git a/...0f-b5fe-03749bbbd8db.idx/metadata.json.gz → ...1a-a7e9-4cfbc473e5d4.idx/metadata.json.gz b/...0f-b5fe-03749bbbd8db.idx/metadata.json.gz → ...1a-a7e9-4cfbc473e5d4.idx/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/metadata.json.gz b/hail_search/fixtures/GRCh38/MITO/annotations.ht/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/rows/.metadata.json.gz.crc b/hail_search/fixtures/GRCh38/MITO/annotations.ht/rows/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh38/MITO/annotations.ht/rows/metadata.json.gz b/hail_search/fixtures/GRCh38/MITO/annotations.ht/rows/metadata.json.gz
diff --git a/...es/GRCh38/MITO/annotations.ht/rows/parts/.part-0-5e9d6c60-87bd-401a-a7e9-4cfbc473e5d4.crc b/...es/GRCh38/MITO/annotations.ht/rows/parts/.part-0-5e9d6c60-87bd-401a-a7e9-4cfbc473e5d4.crc
diff --git a/...es/GRCh38/MITO/annotations.ht/rows/parts/.part-0-636edbd3-d0a9-410f-b5fe-03749bbbd8db.crc b/...es/GRCh38/MITO/annotations.ht/rows/parts/.part-0-636edbd3-d0a9-410f-b5fe-03749bbbd8db.crc
diff --git a/...ixtures/GRCh38/MITO/annotations.ht/rows/parts/part-0-5e9d6c60-87bd-401a-a7e9-4cfbc473e5d4 b/...ixtures/GRCh38/MITO/annotations.ht/rows/parts/part-0-5e9d6c60-87bd-401a-a7e9-4cfbc473e5d4
diff --git a/...ixtures/GRCh38/MITO/annotations.ht/rows/parts/part-0-636edbd3-d0a9-410f-b5fe-03749bbbd8db b/...ixtures/GRCh38/MITO/annotations.ht/rows/parts/part-0-636edbd3-d0a9-410f-b5fe-03749bbbd8db
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/.README.txt.crc b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/.README.txt.crc
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/.metadata.json.gz.crc b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/README.txt b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/README.txt
@@ -1,3 +1,3 @@
 This folder comprises a Hail (www.hail.is) native Table or MatrixTable.
-  Written with version 0.2.128-eead8100a1c1
-  Created at 2024/06/14 15:14:52
+  Written with version 0.2.133-4c60fddb171a
+  Created at 2024/12/04 12:35:22
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/.metadata.json.gz.crc b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/metadata.json.gz b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/parts/.part-0.crc b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/parts/.part-0.crc
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/parts/part-0 b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/globals/parts/part-0
diff --git a/...SNV_INDEL/annotations.ht/index/part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3.idx/.index.crc b/...SNV_INDEL/annotations.ht/index/part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3.idx/.index.crc
diff --git a/...38-a28f441df7a5.idx/.metadata.json.gz.crc → ...cf-961ae060d4c3.idx/.metadata.json.gz.crc b/...38-a28f441df7a5.idx/.metadata.json.gz.crc → ...cf-961ae060d4c3.idx/.metadata.json.gz.crc
diff --git a/...Ch38/SNV_INDEL/annotations.ht/index/part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3.idx/index b/...Ch38/SNV_INDEL/annotations.ht/index/part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3.idx/index
diff --git a/...53-8938-a28f441df7a5.idx/metadata.json.gz → ...6d-a0cf-961ae060d4c3.idx/metadata.json.gz b/...53-8938-a28f441df7a5.idx/metadata.json.gz → ...6d-a0cf-961ae060d4c3.idx/metadata.json.gz
diff --git a/...SNV_INDEL/annotations.ht/index/part-0-664fe3f2-7823-4853-8938-a28f441df7a5.idx/.index.crc b/...SNV_INDEL/annotations.ht/index/part-0-664fe3f2-7823-4853-8938-a28f441df7a5.idx/.index.crc
diff --git a/...Ch38/SNV_INDEL/annotations.ht/index/part-0-664fe3f2-7823-4853-8938-a28f441df7a5.idx/index b/...Ch38/SNV_INDEL/annotations.ht/index/part-0-664fe3f2-7823-4853-8938-a28f441df7a5.idx/index
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/metadata.json.gz b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/metadata.json.gz
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/rows/.metadata.json.gz.crc b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/rows/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/rows/metadata.json.gz b/hail_search/fixtures/GRCh38/SNV_INDEL/annotations.ht/rows/metadata.json.gz
diff --git a/...Ch38/SNV_INDEL/annotations.ht/rows/parts/.part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3.crc b/...Ch38/SNV_INDEL/annotations.ht/rows/parts/.part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3.crc
diff --git a/...Ch38/SNV_INDEL/annotations.ht/rows/parts/.part-0-664fe3f2-7823-4853-8938-a28f441df7a5.crc b/...Ch38/SNV_INDEL/annotations.ht/rows/parts/.part-0-664fe3f2-7823-4853-8938-a28f441df7a5.crc
diff --git a/...es/GRCh38/SNV_INDEL/annotations.ht/rows/parts/part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3 b/...es/GRCh38/SNV_INDEL/annotations.ht/rows/parts/part-0-2b10c852-02a2-426d-a0cf-961ae060d4c3
diff --git a/...es/GRCh38/SNV_INDEL/annotations.ht/rows/parts/part-0-664fe3f2-7823-4853-8938-a28f441df7a5 b/...es/GRCh38/SNV_INDEL/annotations.ht/rows/parts/part-0-664fe3f2-7823-4853-8938-a28f441df7a5
diff --git a/...ata/GRCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/.README.txt.crc b/...ata/GRCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/.README.txt.crc
diff --git a/...Ch38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/.metadata.json.gz.crc b/...Ch38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/.metadata.json.gz.crc
diff --git a/...nce_data/GRCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/README.txt b/...nce_data/GRCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/README.txt
diff --git a/...O/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/.metadata.json.gz.crc b/...O/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/.metadata.json.gz.crc
diff --git a/...8/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/metadata.json.gz b/...8/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/metadata.json.gz
diff --git a/.../MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/.part-0.crc b/.../MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/.part-0.crc
diff --git a/...RCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/part-0 b/...RCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/part-0
diff --git a/...clinvar_path_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/.index.crc b/...clinvar_path_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/.index.crc
diff --git a/...h_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/.metadata.json.gz.crc b/...h_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/.metadata.json.gz.crc
diff --git a/...ries/clinvar_path_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/index b/...ries/clinvar_path_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/index
diff --git a/...r_path_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/metadata.json.gz b/...r_path_variants.ht/index/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.idx/metadata.json.gz
diff --git a/...ta/GRCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/metadata.json.gz b/...ta/GRCh38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/metadata.json.gz
diff --git a/...MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/.metadata.json.gz.crc b/...MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/.metadata.json.gz.crc
diff --git a/...Ch38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/metadata.json.gz b/...Ch38/MITO/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/metadata.json.gz
diff --git a/...ries/clinvar_path_variants.ht/rows/parts/.part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.crc b/...ries/clinvar_path_variants.ht/rows/parts/.part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525.crc
diff --git a/...t_queries/clinvar_path_variants.ht/rows/parts/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525 b/...t_queries/clinvar_path_variants.ht/rows/parts/part-0-51057efb-1c1f-4d03-a0bc-ec8d7b2c6525
diff --git a/hail_search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/.README.txt.crc b/hail_search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/.README.txt.crc
diff --git a/...es/clinvar_path_variants.ht/._SUCCESS.crc → ...TO/clinvar_path_variants.ht/._SUCCESS.crc b/...es/clinvar_path_variants.ht/._SUCCESS.crc → ...TO/clinvar_path_variants.ht/._SUCCESS.crc
diff --git a/...search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/.metadata.json.gz.crc b/...search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/README.txt b/hail_search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/README.txt
@@ -0,0 +1,3 @@
+This folder comprises a Hail (www.hail.is) native Table or MatrixTable.
+  Written with version 0.2.133-4c60fddb171a
+  Created at 2024/12/04 10:48:02
diff --git a/...queries/clinvar_path_variants.ht/_SUCCESS → ...38/MITO/clinvar_path_variants.ht/_SUCCESS b/...queries/clinvar_path_variants.ht/_SUCCESS → ...38/MITO/clinvar_path_variants.ht/_SUCCESS
diff --git a/...ixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/.metadata.json.gz.crc b/...ixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/.metadata.json.gz.crc
diff --git a/...rch/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/metadata.json.gz b/...rch/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/metadata.json.gz
diff --git a/...ch/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/parts/.part-0.crc b/...ch/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/parts/.part-0.crc
diff --git a/..._search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/parts/part-0 b/..._search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/globals/parts/part-0
diff --git a/...clinvar_path_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/.index.crc b/...clinvar_path_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/.index.crc
diff --git a/...h_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/.metadata.json.gz.crc b/...h_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/.metadata.json.gz.crc
diff --git a/...MITO/clinvar_path_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/index b/...MITO/clinvar_path_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/index
diff --git a/...r_path_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/metadata.json.gz b/...r_path_variants.ht/index/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.idx/metadata.json.gz
diff --git a/hail_search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/metadata.json.gz b/hail_search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/metadata.json.gz
diff --git a/...h/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/rows/.metadata.json.gz.crc b/...h/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/rows/.metadata.json.gz.crc
diff --git a/...search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/rows/metadata.json.gz b/...search/fixtures/reference_data/GRCh38/MITO/clinvar_path_variants.ht/rows/metadata.json.gz
diff --git a/...MITO/clinvar_path_variants.ht/rows/parts/.part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.crc b/...MITO/clinvar_path_variants.ht/rows/parts/.part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15.crc
diff --git a/...Ch38/MITO/clinvar_path_variants.ht/rows/parts/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15 b/...Ch38/MITO/clinvar_path_variants.ht/rows/parts/part-0-b856a2ae-7456-4db0-a41f-a4541ce89b15
diff --git a/...RCh38/SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/.README.txt.crc b/...RCh38/SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/.README.txt.crc
diff --git a/...SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/.metadata.json.gz.crc b/...SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/.metadata.json.gz.crc
diff --git a/...ata/GRCh38/SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/README.txt b/...ata/GRCh38/SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/README.txt
diff --git a/...L/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/.metadata.json.gz.crc b/...L/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/.metadata.json.gz.crc
diff --git a/..._INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/metadata.json.gz b/..._INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/metadata.json.gz
diff --git a/...INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/.part-0.crc b/...INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/.part-0.crc
diff --git a/.../SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/part-0 b/.../SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/globals/parts/part-0
diff --git a/...clinvar_path_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/.index.crc b/...clinvar_path_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/.index.crc
diff --git a/...h_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/.metadata.json.gz.crc b/...h_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/.metadata.json.gz.crc
diff --git a/...ries/clinvar_path_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/index b/...ries/clinvar_path_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/index
diff --git a/...r_path_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/metadata.json.gz b/...r_path_variants.ht/index/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.idx/metadata.json.gz
diff --git a/...Ch38/SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/metadata.json.gz b/...Ch38/SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/metadata.json.gz
diff --git a/...NDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/.metadata.json.gz.crc b/...NDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/.metadata.json.gz.crc
diff --git a/...SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/metadata.json.gz b/...SNV_INDEL/cached_reference_dataset_queries/clinvar_path_variants.ht/rows/metadata.json.gz
diff --git a/...ries/clinvar_path_variants.ht/rows/parts/.part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.crc b/...ries/clinvar_path_variants.ht/rows/parts/.part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5.crc
diff --git a/...t_queries/clinvar_path_variants.ht/rows/parts/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5 b/...t_queries/clinvar_path_variants.ht/rows/parts/part-0-23b3a09d-4799-4bcb-9e13-c2812c6915c5
diff --git a/...ata/GRCh38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/.README.txt.crc b/...ata/GRCh38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/.README.txt.crc
diff --git a/...Ch38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/.metadata.json.gz.crc b/...Ch38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/.metadata.json.gz.crc
diff --git a/...nce_data/GRCh38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/README.txt b/...nce_data/GRCh38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/README.txt
diff --git a/...ta/GRCh38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/metadata.json.gz b/...ta/GRCh38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/metadata.json.gz
diff --git a/...SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/rows/.metadata.json.gz.crc b/...SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/rows/.metadata.json.gz.crc
diff --git a/...Ch38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/rows/metadata.json.gz b/...Ch38/SNV_INDEL/cached_reference_dataset_queries/high_af_variants.ht/rows/metadata.json.gz
diff --git a/..._search/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/.README.txt.crc b/..._search/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/.README.txt.crc
diff --git a/...es/clinvar_path_variants.ht/._SUCCESS.crc → ...EL/clinvar_path_variants.ht/._SUCCESS.crc b/...es/clinvar_path_variants.ht/._SUCCESS.crc → ...EL/clinvar_path_variants.ht/._SUCCESS.crc
diff --git a/...h/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/.metadata.json.gz.crc b/...h/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/README.txt b/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/README.txt
@@ -0,0 +1,3 @@
+This folder comprises a Hail (www.hail.is) native Table or MatrixTable.
+  Written with version 0.2.133-4c60fddb171a
+  Created at 2024/12/04 10:46:25
diff --git a/...queries/clinvar_path_variants.ht/_SUCCESS → ...V_INDEL/clinvar_path_variants.ht/_SUCCESS b/...queries/clinvar_path_variants.ht/_SUCCESS → ...V_INDEL/clinvar_path_variants.ht/_SUCCESS
diff --git a/...variants.ht/globals/.metadata.json.gz.crc → ...variants.ht/globals/.metadata.json.gz.crc b/...variants.ht/globals/.metadata.json.gz.crc → ...variants.ht/globals/.metadata.json.gz.crc
diff --git a/...h_af_variants.ht/globals/metadata.json.gz → ...path_variants.ht/globals/metadata.json.gz b/...h_af_variants.ht/globals/metadata.json.gz → ...path_variants.ht/globals/metadata.json.gz
diff --git a/..._af_variants.ht/globals/parts/.part-0.crc → ...ath_variants.ht/globals/parts/.part-0.crc b/..._af_variants.ht/globals/parts/.part-0.crc → ...ath_variants.ht/globals/parts/.part-0.crc
diff --git a/.../high_af_variants.ht/globals/parts/part-0 → ...var_path_variants.ht/globals/parts/part-0 b/.../high_af_variants.ht/globals/parts/part-0 → ...var_path_variants.ht/globals/parts/part-0
diff --git a/...clinvar_path_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/.index.crc b/...clinvar_path_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/.index.crc
diff --git a/...h_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/.metadata.json.gz.crc b/...h_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/.metadata.json.gz.crc
diff --git a/...NDEL/clinvar_path_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/index b/...NDEL/clinvar_path_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/index
diff --git a/...r_path_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/metadata.json.gz b/...r_path_variants.ht/index/part-0-c010d599-ce86-4363-be96-0c7b7120788b.idx/metadata.json.gz
diff --git a/...search/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/metadata.json.gz b/...search/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/metadata.json.gz
diff --git a/...tures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/rows/.metadata.json.gz.crc b/...tures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/rows/.metadata.json.gz.crc
diff --git a/...h/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/rows/metadata.json.gz b/...h/fixtures/reference_data/GRCh38/SNV_INDEL/clinvar_path_variants.ht/rows/metadata.json.gz
diff --git a/...NDEL/clinvar_path_variants.ht/rows/parts/.part-0-c010d599-ce86-4363-be96-0c7b7120788b.crc b/...NDEL/clinvar_path_variants.ht/rows/parts/.part-0-c010d599-ce86-4363-be96-0c7b7120788b.crc
diff --git a/...SNV_INDEL/clinvar_path_variants.ht/rows/parts/part-0-c010d599-ce86-4363-be96-0c7b7120788b b/...SNV_INDEL/clinvar_path_variants.ht/rows/parts/part-0-c010d599-ce86-4363-be96-0c7b7120788b
diff --git a/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/.README.txt.crc b/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/.README.txt.crc
diff --git a/...queries/high_af_variants.ht/._SUCCESS.crc → ...V_INDEL/high_af_variants.ht/._SUCCESS.crc b/...queries/high_af_variants.ht/._SUCCESS.crc → ...V_INDEL/high_af_variants.ht/._SUCCESS.crc
diff --git a/...search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/.metadata.json.gz.crc b/...search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/.metadata.json.gz.crc
diff --git a/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/README.txt b/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/README.txt
@@ -0,0 +1,3 @@
+This folder comprises a Hail (www.hail.is) native Table or MatrixTable.
+  Written with version 0.2.133-4c60fddb171a
+  Created at 2024/12/04 10:46:46
diff --git a/...aset_queries/high_af_variants.ht/_SUCCESS → ...38/SNV_INDEL/high_af_variants.ht/_SUCCESS b/...aset_queries/high_af_variants.ht/_SUCCESS → ...38/SNV_INDEL/high_af_variants.ht/_SUCCESS
diff --git a/...ixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/.metadata.json.gz.crc b/...ixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/.metadata.json.gz.crc
diff --git a/...rch/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/metadata.json.gz b/...rch/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/metadata.json.gz
diff --git a/...ch/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/parts/.part-0.crc b/...ch/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/parts/.part-0.crc
diff --git a/..._search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/parts/part-0 b/..._search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/globals/parts/part-0
diff --git a/...016-474d-b435-c7d356e21767.idx/.index.crc → ...831-487d-aa28-ddc09f0c48dc.idx/.index.crc b/...016-474d-b435-c7d356e21767.idx/.index.crc → ...831-487d-aa28-ddc09f0c48dc.idx/.index.crc
diff --git a/...35-c7d356e21767.idx/.metadata.json.gz.crc → ...28-ddc09f0c48dc.idx/.metadata.json.gz.crc b/...35-c7d356e21767.idx/.metadata.json.gz.crc → ...28-ddc09f0c48dc.idx/.metadata.json.gz.crc
diff --git a/...d66-9016-474d-b435-c7d356e21767.idx/index → ...5ff-3831-487d-aa28-ddc09f0c48dc.idx/index b/...d66-9016-474d-b435-c7d356e21767.idx/index → ...5ff-3831-487d-aa28-ddc09f0c48dc.idx/index
diff --git a/...4d-b435-c7d356e21767.idx/metadata.json.gz → ...7d-aa28-ddc09f0c48dc.idx/metadata.json.gz b/...4d-b435-c7d356e21767.idx/metadata.json.gz → ...7d-aa28-ddc09f0c48dc.idx/metadata.json.gz
diff --git a/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/metadata.json.gz b/hail_search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/metadata.json.gz
diff --git a/...h/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/rows/.metadata.json.gz.crc b/...h/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/rows/.metadata.json.gz.crc
diff --git a/...search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/rows/metadata.json.gz b/...search/fixtures/reference_data/GRCh38/SNV_INDEL/high_af_variants.ht/rows/metadata.json.gz
diff --git a/...-fbbd1d66-9016-474d-b435-c7d356e21767.crc → ...-40b6b5ff-3831-487d-aa28-ddc09f0c48dc.crc b/...-fbbd1d66-9016-474d-b435-c7d356e21767.crc → ...-40b6b5ff-3831-487d-aa28-ddc09f0c48dc.crc
diff --git a/...rt-0-fbbd1d66-9016-474d-b435-c7d356e21767 → ...rt-0-40b6b5ff-3831-487d-aa28-ddc09f0c48dc b/...rt-0-fbbd1d66-9016-474d-b435-c7d356e21767 → ...rt-0-40b6b5ff-3831-487d-aa28-ddc09f0c48dc
diff --git a/hail_search/queries/base.py b/hail_search/queries/base.py
@@ -1218,7 +1218,7 @@ def gene_counts(self):
 
     def lookup_variants(self, variant_ids, include_project_data=False, **kwargs):
         self._parse_intervals(intervals=None, variant_ids=variant_ids, variant_keys=variant_ids)
-        ht = self._read_table('annotations.ht', drop_globals=['paths', 'versions'])
+        ht = self._read_table('annotations.ht', drop_globals=['versions'])
         ht = ht.filter(hl.is_defined(ht[XPOS]))
 
         annotation_fields = self.annotation_fields(include_genotype_overrides=False)

diff --git a/hail_search/queries/mito.py b/hail_search/queries/mito.py
@@ -5,7 +5,7 @@
 import logging
 import os
 
-from hail_search.constants import ABSENT_PATH_SORT_OFFSET, CLINVAR_KEY, CLINVAR_MITO_KEY, CLINVAR_LIKELY_PATH_FILTER, \
+from hail_search.constants import ABSENT_PATH_SORT_OFFSET, CLINVAR_KEY, CLINVAR_LIKELY_PATH_FILTER, \
     CLINVAR_PATH_FILTER, \
     CLINVAR_PATH_RANGES, CLINVAR_PATH_SIGNIFICANCES, ALLOWED_TRANSCRIPTS, ALLOWED_SECONDARY_TRANSCRIPTS, \
     PATHOGENICTY_SORT_KEY, CONSEQUENCE_SORT, \
@@ -14,7 +14,6 @@
 from hail_search.queries.base import BaseHailTableQuery, PredictionPath, QualityFilterFormat, MAX_PARTITIONS
 
 REFERENCE_DATASETS_DIR = os.environ.get('REFERENCE_DATASETS_DIR', '/seqr/seqr-reference-data')
-REFERENCE_DATASET_SUBDIR = 'cached_reference_dataset_queries'
 
 logger = logging.getLogger(__name__)
 
@@ -57,15 +56,14 @@ class MitoHailTableQuery(BaseHailTableQuery):
         'haplogroup_defining': PredictionPath('haplogroup', 'is_defining', lambda v: hl.or_missing(v, 'Y')),
         'hmtvar': PredictionPath('hmtvar', 'score'),
         'mitotip': PredictionPath('mitotip', 'trna_prediction'),
-        'mut_taster': PredictionPath('dbnsfp_mito', 'MutationTaster_pred'),
-        'sift': PredictionPath('dbnsfp_mito', 'SIFT_score'),
+        'mut_taster': PredictionPath('dbnsfp', 'MutationTaster_pred'),
+        'sift': PredictionPath('dbnsfp', 'SIFT_score'),
         'mlc': PredictionPath('local_constraint_mito', 'score'),
     }
 
     PATHOGENICITY_FILTERS = {
         CLINVAR_KEY: ('pathogenicity', CLINVAR_PATH_RANGES),
     }
-    PATHOGENICITY_FIELD_MAP = {CLINVAR_KEY: CLINVAR_MITO_KEY}
 
     GLOBALS = BaseHailTableQuery.GLOBALS + ['versions']
     CORE_FIELDS = BaseHailTableQuery.CORE_FIELDS + ['rsid']
@@ -86,7 +84,7 @@ class MitoHailTableQuery(BaseHailTableQuery):
         **BaseHailTableQuery.BASE_ANNOTATION_FIELDS,
     }
     ENUM_ANNOTATION_FIELDS = {
-        CLINVAR_MITO_KEY: {
+        CLINVAR_KEY: {
             'response_key': CLINVAR_KEY,
             'include_version': True,
             'annotate_value': lambda value, enum: {
@@ -109,7 +107,7 @@ class MitoHailTableQuery(BaseHailTableQuery):
             hl.min(r.sorted_transcript_consequences.flatmap(lambda t: t.consequence_term_ids)),
             hl.min(r.selected_transcript.consequence_term_ids),
         ],
-        PATHOGENICTY_SORT_KEY: lambda r: [_clinvar_sort(CLINVAR_MITO_KEY, r)],
+        PATHOGENICTY_SORT_KEY: lambda r: [_clinvar_sort(CLINVAR_KEY, r)],
         **BaseHailTableQuery.SORTS,
     }
     SORTS[PATHOGENICTY_HGMD_SORT_KEY] = SORTS[PATHOGENICTY_SORT_KEY]
@@ -363,7 +361,7 @@ def _get_loaded_filter_ht(self, key, get_filters, **kwargs):
             if ht_filter is False:
                 self._filter_hts[key] = False
             else:
-                ht = self._read_table(f'{REFERENCE_DATASET_SUBDIR}/{self.PREFILTER_TABLES[key]}')
+                ht = self._read_table(f'{self.PREFILTER_TABLES[key]}')
                 if ht_filter is not True:
                     ht = ht.filter(ht_filter(ht))
                 self._filter_hts[key] = ht
@@ -372,7 +370,7 @@ def _get_loaded_filter_ht(self, key, get_filters, **kwargs):
 
     @classmethod
     def _get_table_dir(cls, path):
-        if REFERENCE_DATASET_SUBDIR in path:
+        if any(prefilter_table_path in path for prefilter_table_path in cls.PREFILTER_TABLES.values()):
             return REFERENCE_DATASETS_DIR
         return super()._get_table_dir(path)
 
@@ -486,8 +484,7 @@ def _get_clinvar_path_filters(pathogenicity):
 
     def _has_path_expr(self, ht, terms, field):
         subfield, range_configs = self.PATHOGENICITY_FILTERS[field]
-        field_name = self.PATHOGENICITY_FIELD_MAP.get(field, field)
-        enum_lookup = self._get_enum_lookup(field_name, subfield)
+        enum_lookup = self._get_enum_lookup(field, subfield)
 
         ranges = [[None, None]]
         for path_filter, start, end in range_configs:
@@ -499,7 +496,7 @@ def _has_path_expr(self, ht, terms, field):
                 ranges.append([None, None])
 
         ranges = [r for r in ranges if r[0] is not None]
-        value = ht[field_name][f'{subfield}_id']
+        value = ht[field][f'{subfield}_id']
         return hl.any(lambda r: (value >= r[0]) & (value <= r[1]), ranges)
 
     def _format_results(self, ht, *args, **kwargs):

diff --git a/hail_search/queries/snv_indel_37.py b/hail_search/queries/snv_indel_37.py
@@ -1,8 +1,8 @@
 from collections import OrderedDict
 import hail as hl
 
-from hail_search.constants import CLINVAR_KEY, CLINVAR_MITO_KEY, HGMD_KEY, HGMD_PATH_RANGES, \
-    GNOMAD_GENOMES_FIELD, PREFILTER_FREQ_CUTOFF, PATH_FREQ_OVERRIDE_CUTOFF, PATHOGENICTY_SORT_KEY, PATHOGENICTY_HGMD_SORT_KEY, \
+from hail_search.constants import CLINVAR_KEY, HGMD_KEY, HGMD_PATH_RANGES, \
+    GNOMAD_GENOMES_FIELD, PREFILTER_FREQ_CUTOFF, PATH_FREQ_OVERRIDE_CUTOFF, PATHOGENICTY_HGMD_SORT_KEY, \
     SPLICE_AI_FIELD, GENOME_VERSION_GRCh37
 from hail_search.queries.base import PredictionPath, QualityFilterFormat
 from hail_search.queries.mito import MitoHailTableQuery
@@ -28,10 +28,10 @@ class SnvIndelHailTableQuery37(MitoHailTableQuery):
         GNOMAD_GENOMES_FIELD: {'filter_af': 'AF_POPMAX_OR_GLOBAL', 'het': None, 'sort': 'gnomad'},
     }
     PREDICTION_FIELDS_CONFIG = {
-        'cadd': PredictionPath('cadd', 'PHRED'),
+        'cadd': PredictionPath('dbnsfp', 'CADD_phred'),
         'eigen': PredictionPath('eigen', 'Eigen_phred'),
-        'mpc': PredictionPath('mpc', 'MPC'),
-        'primate_ai': PredictionPath('primate_ai', 'score'),
+        'mpc': PredictionPath('dbnsfp', 'MPC_score'),
+        'primate_ai': PredictionPath('dbnsfp', 'PrimateAI_score'),
         SPLICE_AI_FIELD: PredictionPath(SPLICE_AI_FIELD, 'delta_score'),
         'splice_ai_consequence': PredictionPath(SPLICE_AI_FIELD, 'splice_consequence'),
         'mut_taster': PredictionPath('dbnsfp', 'MutationTaster_pred'),
@@ -43,7 +43,6 @@ class SnvIndelHailTableQuery37(MitoHailTableQuery):
         **MitoHailTableQuery.PATHOGENICITY_FILTERS,
         HGMD_KEY: ('class', HGMD_PATH_RANGES),
     }
-    PATHOGENICITY_FIELD_MAP = {}
     ANNOTATION_OVERRIDE_FIELDS = [SPLICE_AI_FIELD]
 
     CORE_FIELDS = MitoHailTableQuery.CORE_FIELDS + ['CAID']
@@ -60,11 +59,9 @@ class SnvIndelHailTableQuery37(MitoHailTableQuery):
             'format_value': lambda value: value.region_types.first(),
         },
     }
-    ENUM_ANNOTATION_FIELDS[CLINVAR_KEY] = ENUM_ANNOTATION_FIELDS.pop(CLINVAR_MITO_KEY)
 
     SORTS = {
         **MitoHailTableQuery.SORTS,
-        PATHOGENICTY_SORT_KEY: lambda r: [MitoHailTableQuery.CLINVAR_SORT(CLINVAR_KEY, r)],
         PATHOGENICTY_HGMD_SORT_KEY: lambda r: [MitoHailTableQuery.CLINVAR_SORT(CLINVAR_KEY, r), r.hgmd.class_id],
     }
 

diff --git a/reference_data/management/commands/update_all_reference_data.py b/reference_data/management/commands/update_all_reference_data.py
@@ -14,6 +14,7 @@
 from reference_data.management.commands.update_gencc import GenCCReferenceDataHandler
 from reference_data.management.commands.update_clingen import ClinGenReferenceDataHandler
 from reference_data.management.commands.update_refseq import RefseqReferenceDataHandler
+from reference_data.models import GeneInfo
 
 
 logger = logging.getLogger(__name__)
@@ -52,6 +53,9 @@ def handle(self, *args, **options):
         update_failed = []
 
         if not options["skip_gencode"]:
+            if GeneInfo.objects.count() > 0:
+                logger.info('Skipping update_all_reference_data because GeneInfo is already loaded')
+                return
             # Download latest version first, and then add any genes from old releases not included in the latest release
             # Old gene ids are used in the gene constraint table and other datasets, as well as older sequencing data
             update_gencode(LATEST_GENCODE_RELEASE, reset=True)

diff --git a/reference_data/management/tests/update_all_reference_data_tests.py b/reference_data/management/tests/update_all_reference_data_tests.py
@@ -11,6 +11,7 @@
 from reference_data.management.commands.update_gencc import GenCCReferenceDataHandler
 from reference_data.management.commands.update_clingen import ClinGenReferenceDataHandler
 from reference_data.management.commands.update_refseq import RefseqReferenceDataHandler
+from reference_data.models import GeneInfo
 
 
 def omim_exception(omim_key):
@@ -78,7 +79,15 @@ def test_update_all_reference_data_command(self):
             call_command('update_all_reference_data')
         self.assertEqual(str(err.exception), 'Error: one of the arguments --omim-key --use-cached-omim --skip-omim is required')
 
+        # Test update is skipped when data is already loaded
+        self.mock_update_gencode.assert_not_called()
+        self.mock_omim.assert_not_called()
+        self.mock_cached_omim.assert_not_called()
+        self.mock_update_records.assert_not_called()
+        self.mock_update_hpo.assert_not_called()
+
         # Test update all gencode, no skips, fail primate_ai and mgi
+        GeneInfo.objects.all().delete()
         call_command('update_all_reference_data', '--omim-key=test_key')
 
         calls = [

diff --git a/seqr/utils/search/add_data_utils.py b/seqr/utils/search/add_data_utils.py
@@ -6,11 +6,13 @@
 from seqr.models import Sample, Individual, Project
 from seqr.utils.communication_utils import send_project_notification, safe_post_to_slack
 from seqr.utils.logging_utils import SeqrLogger
+from seqr.utils.middleware import ErrorsWarningsException
 from seqr.utils.search.utils import backend_specific_call
 from seqr.utils.search.elasticsearch.es_utils import validate_es_index_metadata_and_get_samples
 from seqr.views.utils.airtable_utils import AirtableSession, ANVIL_REQUEST_TRACKING_TABLE
 from seqr.views.utils.dataset_utils import match_and_update_search_samples, load_mapping_file
 from seqr.views.utils.export_utils import write_multiple_files
+from seqr.views.utils.pedigree_info_utils import get_no_affected_families
 from settings import SEQR_SLACK_DATA_ALERTS_NOTIFICATION_CHANNEL, BASE_URL, ANVIL_UI_URL, \
     SEQR_SLACK_ANVIL_DATA_LOADING_CHANNEL
 
@@ -144,14 +146,23 @@ def _upload_data_loading_files(projects: list[Project], user: User, file_path: s
         'Individual_ID': F('individual_id'),
         'Paternal_ID': F('father__individual_id'), 'Maternal_ID': F('mother__individual_id'), 'Sex': F('sex'),
     })
-    annotations = {'project': F('family__project__guid'), **file_annotations}
+    annotations = {'project': F('family__project__guid'), 'affected_status': F('affected'), **file_annotations}
     individual_filter = {'id__in': individual_ids} if individual_ids else {'family__project__in': projects}
     data = Individual.objects.filter(**individual_filter).order_by('family_id', 'individual_id').values(
         **dict(annotations))
 
     data_by_project = defaultdict(list)
+    affected_by_family = defaultdict(list)
     for row in data:
         data_by_project[row.pop('project')].append(row)
+        affected_by_family[row['Family_GUID']].append(row.pop('affected_status'))
+
+    no_affected_families =get_no_affected_families(affected_by_family)
+    if no_affected_families:
+        families = ', '.join(sorted(no_affected_families))
+        raise ErrorsWarningsException(errors=[
+            f'The following families have no affected individuals and can not be loaded to seqr: {families}',
+        ])
 
     header = list(file_annotations.keys())
     files = [(f'{project_guid}_pedigree', header, rows) for project_guid, rows in data_by_project.items()]

diff --git a/seqr/views/apis/anvil_workspace_api.py b/seqr/views/apis/anvil_workspace_api.py
@@ -188,7 +188,7 @@ def create_project_from_workspace(request, namespace, name):
         error = 'Field(s) "{}" are required'.format(', '.join(missing_fields))
         return create_json_response({'error': error}, status=400, reason=error)
 
-    pedigree_records, _ = _parse_uploaded_pedigree(request_json)
+    pedigree_records = _parse_uploaded_pedigree(request_json)
 
     # Create a new Project in seqr
     project_args = {
@@ -229,7 +229,7 @@ def add_workspace_data(request, project_guid):
         error = 'Field(s) "{}" are required'.format(', '.join(missing_fields))
         return create_json_response({'error': error}, status=400, reason=error)
 
-    pedigree_records, records_by_family = _parse_uploaded_pedigree(request_json, project=project)
+    pedigree_records = _parse_uploaded_pedigree(request_json, project=project)
 
     previous_samples = get_search_samples([project]).filter(dataset_type=Sample.DATASET_TYPE_VARIANT_CALLS)
     sample = previous_samples.first()
@@ -239,8 +239,9 @@ def add_workspace_data(request, project_guid):
         }, status=400)
     sample_type = sample.sample_type
 
+    families = {record[JsonConstants.FAMILY_ID_COLUMN] for record in pedigree_records}
     previous_loaded_individuals = previous_samples.filter(
-        individual__family__family_id__in=records_by_family,
+        individual__family__family_id__in=families,
     ).values_list('individual_id', 'individual__individual_id', 'individual__family__family_id')
     missing_samples_by_family = defaultdict(list)
     for _, individual_id, family_id in previous_loaded_individuals:
@@ -279,22 +280,10 @@ def _parse_uploaded_pedigree(request_json, project=None):
         errors.append('The following samples are included in the pedigree file but are missing from the VCF: {}'.format(
                 ', '.join(missing_samples)))
 
-    records_by_family = defaultdict(list)
-    for record in pedigree_records:
-        records_by_family[record[JsonConstants.FAMILY_ID_COLUMN]].append(record)
-
-    no_affected_families = [
-        family_id for family_id, records in records_by_family.items()
-        if not any(record[JsonConstants.AFFECTED_COLUMN] == Individual.AFFECTED_STATUS_AFFECTED for record in records)
-    ]
-
-    if no_affected_families:
-        errors.append('The following families do not have any affected individuals: {}'.format(', '.join(no_affected_families)))
-
     if errors:
         raise ErrorsWarningsException(errors, [])
 
-    return pedigree_records, records_by_family
+    return pedigree_records
 
 
 def _trigger_add_workspace_data(project, pedigree_records, user, data_path, sample_type, previous_loaded_ids=None, get_pedigree_json=False):
@@ -331,7 +320,7 @@ def _trigger_add_workspace_data(project, pedigree_records, user, data_path, samp
         try:
             email_body = f"""Hi {user.get_full_name() or user.email},
             We have received your request to load data to seqr from AnVIL. Currently, the Broad Institute is holding an 
-            internal retreat or closed for the winter break so we are unable to load data until mid-January 
+            internal retreat or closed for the winter break so we may not be able to load data until mid-January 
             {loading_warning_date.year + 1}. We appreciate your understanding and support of our research team taking 
             some well-deserved time off and hope you also have a nice break.
             - The seqr team