Skip to content

Commit ce140ee

Browse files
Xavier MedranoXavier Medrano
Xavier Medrano
authored and
Xavier Medrano
committed
add more church names
1 parent 4f49be9 commit ce140ee

File tree

2 files changed

+13
-15
lines changed

2 files changed

+13
-15
lines changed

name_data/labeled/company_labeled.xml

+12-14
Original file line numberDiff line numberDiff line change
@@ -29,8 +29,7 @@
2929
<Name><CorporationName>area</CorporationName> <CorporationName>property</CorporationName> <CorporationName>service</CorporationName></Name>
3030
<Name><CorporationName>seiu</CorporationName> <CorporationCommitteeType>political</CorporationCommitteeType> <CorporationCommitteeType>fund</CorporationCommitteeType></Name>
3131
<Name><CorporationName>gp</CorporationName> <CorporationNameOrganization>corp</CorporationNameOrganization></Name>
32-
<Name>
33-
<ShortForm>bbc</ShortForm>
32+
<Name><ShortForm>bbc</ShortForm>
3433
</Name>
3534
<Name><CorporationName>kaleo</CorporationName> <CorporationLegalType>inc</CorporationLegalType> <AKA>dba</AKA> <CorporationName>cleo's</CorporationName></Name>
3635
<Name><CorporationName>motorola,</CorporationName> <CorporationLegalType>inc.</CorporationLegalType></Name>
@@ -66,8 +65,7 @@
6665
<Name><CorporationName>american</CorporationName> <CorporationName>mobile</CorporationName> <CorporationName>staging</CorporationName> <CorporationLegalType>inc.</CorporationLegalType></Name>
6766
<Name><CorporationName>stu's</CorporationName> <CorporationName>bargain</CorporationName> <CorporationName>outlet</CorporationName></Name>
6867
<Name><CorporationName>nekritz</CorporationName> <CorporationName>for</CorporationName> <CorporationName>state</CorporationName> <CorporationName>representative</CorporationName></Name>
69-
<Name>
70-
<CorporationName>eve's</CorporationName>
68+
<Name><CorporationName>eve's</CorporationName>
7169
</Name>
7270
<Name><CorporationName>united</CorporationName> <CorporationName>gasket</CorporationName> <CorporationNameOrganization>corporation</CorporationNameOrganization></Name>
7371
<Name><CorporationName>petropoulos</CorporationName> <CorporationName>washer</CorporationName> <CorporationName>service</CorporationName></Name>
@@ -140,8 +138,7 @@
140138
<Name><CorporationName>skyway</CorporationName> <CorporationName>elevator</CorporationName> <CorporationLegalType>inc</CorporationLegalType></Name>
141139
<Name><CorporationName>hammond</CorporationName> <CorporationName>fence</CorporationName> <CorporationNameOrganization>co.</CorporationNameOrganization> <CorporationName>of</CorporationName> <CorporationName>indiana</CorporationName> <CorporationLegalType>inc.</CorporationLegalType></Name>
142140
<Name><CorporationName>crain</CorporationName> <CorporationName>&amp;</CorporationName> <CorporationName>feed</CorporationName> <CorporationNameOrganization>legislative</CorporationNameOrganization> <CorporationNameOrganization>council</CorporationNameOrganization></Name>
143-
<Name>
144-
<CorporationName>restaurant.com</CorporationName>
141+
<Name><CorporationName>restaurant.com</CorporationName>
145142
</Name>
146143
<Name><CorporationName>op</CorporationName> <CorporationName>plstrs</CorporationName> <CorporationName>&amp;</CorporationName> <CorporationName>cmnt</CorporationName> <CorporationName>mason</CorporationName> <CorporationNameBranchType>local</CorporationNameBranchType> <CorporationNameBranchIdentifier>#18</CorporationNameBranchIdentifier></Name>
147144
<Name><CorporationName>u</CorporationName> <CorporationName>s</CorporationName> <CorporationName>paving</CorporationName></Name>
@@ -252,8 +249,7 @@
252249
<Name><CorporationName>state</CorporationName> <CorporationName>of</CorporationName> <CorporationName>illinois</CorporationName> <CorporationName>fraternal</CorporationName> <CorporationName>order</CorporationName> <CorporationName>of</CorporationName> <CorporationName>police</CorporationName> <CorporationNameBranchType>lodge</CorporationNameBranchType> <CorporationNameBranchIdentifier>72</CorporationNameBranchIdentifier></Name>
253250
<Name><CorporationName>mangieri</CorporationName> <CorporationName>electric</CorporationName></Name>
254251
<Name><CorporationName>billy</CorporationName> <CorporationName>goat</CorporationName> <CorporationName>north</CorporationName> <CorporationNameBranchIdentifier>ii</CorporationNameBranchIdentifier> <CorporationLegalType>inc.</CorporationLegalType></Name>
255-
<Name>
256-
<ShortForm>cfem</ShortForm>
252+
<Name><ShortForm>cfem</ShortForm>
257253
</Name>
258254
<Name><CorporationName>abc</CorporationName> <CorporationName>auto</CorporationName></Name>
259255
<Name><CorporationName>eclipse</CorporationName>
@@ -284,8 +280,7 @@
284280
<Name><CorporationName>marian</CorporationName> <CorporationName>realty</CorporationName></Name>
285281
<Name><CorporationName>napleton</CorporationName> <CorporationName>honda</CorporationName></Name>
286282
<Name><CorporationName>napoli</CorporationName> <CorporationName>pizza</CorporationName></Name>
287-
<Name>
288-
<CorporationName>smitherine</CorporationName>
283+
<Name><CorporationName>smitherine</CorporationName>
289284
</Name>
290285
<Name><CorporationName>beecken</CorporationName> <CorporationName>petty</CorporationName> <CorporationName>o'keefe</CorporationName> <CorporationNameAndCompany>&amp;</CorporationNameAndCompany> <CorporationNameAndCompany>company</CorporationNameAndCompany> <CorporationLegalType>llc</CorporationLegalType></Name>
291286
<Name><CorporationName>sociedad</CorporationName> <CorporationName>civica</CorporationName> <CorporationName>cultural</CorporationName> <CorporationName>centroamericana</CorporationName></Name>
@@ -726,8 +721,7 @@
726721
<Name><CorporationName>New</CorporationName> <CorporationName>Image</CorporationName> <CorporationName>Dentistry</CorporationName></Name>
727722
<Name><CorporationName>Atkinson</CorporationName> <CorporationName>Family</CorporationName> <CorporationName>Dentistry</CorporationName></Name>
728723
<Name><CorporationName>Kids</CorporationName> <CorporationName>Teeth</CorporationName></Name>
729-
<Name>
730-
<CorporationName>PreZenDental</CorporationName>
724+
<Name><CorporationName>PreZenDental</CorporationName>
731725
</Name>
732726
<Name><CorporationName>ALEX</CorporationName> <CorporationName>DISPLAYS</CorporationName> <CorporationNameAndCompany>&amp;</CorporationNameAndCompany> <CorporationNameAndCompany>CO</CorporationNameAndCompany> <CorporationLegalType>INC</CorporationLegalType></Name>
733727
<Name><CorporationName>swidler</CorporationName> <CorporationName>spanola</CorporationName> <CorporationNameAndCompany>&amp;</CorporationNameAndCompany> <CorporationNameAndCompany>co,</CorporationNameAndCompany> <CorporationLegalType>llc</CorporationLegalType></Name>
@@ -1471,8 +1465,7 @@
14711465
<Name><CorporationName>Hope</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
14721466
<Name><CorporationName>Congregation</CorporationName> <CorporationName>Adath</CorporationName> <CorporationName>Jeshurun</CorporationName></Name>
14731467
<Name><CorporationName>Central</CorporationName> <CorporationNameOrganization>Methodist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
1474-
<Name>
1475-
<CorporationName>HerChurch</CorporationName>
1468+
<Name><CorporationName>HerChurch</CorporationName>
14761469
</Name>
14771470
<Name><CorporationName>Wyco</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
14781471
<Name><CorporationNameOrganization>Methodist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization> <CorporationName>Concord</CorporationName></Name>
@@ -1492,4 +1485,9 @@
14921485
<Name><CorporationName>Ben</CorporationName> <CorporationName>Hill</CorporationName> <CorporationName>United</CorporationName> <CorporationNameOrganization>Methodist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
14931486
<Name><CorporationName>Mount</CorporationName> <CorporationName>Hope</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
14941487
<Name><CorporationName>Vineyard</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization> <CorporationName>of</CorporationName> <CorporationName>Ann</CorporationName> <CorporationName>Arbor</CorporationName></Name>
1488+
<Name><CorporationName>Christ</CorporationName> <CorporationNameOrganization>Episcopal</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
1489+
<Name><CorporationName>Elizabeth</CorporationName> <CorporationNameOrganization>Baptist</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
1490+
<Name><CorporationName>Sacred</CorporationName> <CorporationName>Heart</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
1491+
<Name><CorporationName>St.</CorporationName> <CorporationName>Mark</CorporationName> <CorporationNameOrganization>Lutheran</CorporationNameOrganization> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
1492+
<Name><CorporationName>Holy</CorporationName> <CorporationName>Rosary</CorporationName> <CorporationNameOrganization>Church</CorporationNameOrganization></Name>
14951493
</NameCollection>

tests/test_tagging.py

+1-1
Original file line numberDiff line numberDiff line change
@@ -19,7 +19,7 @@ def test_basic():
1919
"name_text,components",
2020
readTrainingData(["tests/test_data_labeled.xml"], GROUP_LABEL),
2121
)
22-
def test_simple_addresses(name_text, components):
22+
def test_names(name_text, components):
2323

2424
_, labels_true = list(zip(*components))
2525
_, labels_pred = list(zip(*parse(name_text)))

0 commit comments

Comments
 (0)