You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
# Issues caused by errors in the original annotation must be fixed early.
355
381
# Especially if acl|advcl occurs with a preposition that unambiguously
356
382
# receives a morphological case in the subsequent steps, and then gets
357
383
# flagged as solved.
358
-
edep['deprel'] =re.sub(r'^advcl:do(?::gen)?$', r'obl:do:gen', edep['deprel']) # od nevidím do nevidím ###!!! Ale měli bychom opravit i závislost v základním stromu!
359
-
edep['deprel'] =re.sub(r'^advcl:pro(?::acc)?$', r'advcl:aby', edep['deprel']) # byl by pro, abychom... ###!!! Opravit i konverzi stromu.
360
-
edep['deprel'] =re.sub(r'^advcl:s(?::ins)?$', r'advcl', edep['deprel']) ###!!! "seděli jsme tam s Člověče, nezlob se!" Měla by se opravit konverze stromu.
edep['deprel'] =re.sub(r'^advcl:od(?::gen)?$', r'obl:od:gen', edep['deprel']) # od nevidím do nevidím ###!!! Ale měli bychom opravit i závislost v základním stromu!
edep['deprel'] =re.sub(r'^nmod:když.*$', r'nmod', edep['deprel']) # nadějí když ne na zbohatnutí, tak alespoň na dobrou obživu ###!!! perhaps "když" or "když ne" should be analyzed as "cc" here!
373
-
edep['deprel'] =re.sub(r'^obl:ačkoli.*$', r'obl', edep['deprel']) # nadějí když ne na zbohatnutí, tak alespoň na dobrou obživu ###!!! perhaps "když" or "když ne" should be analyzed as "cc" here!
374
-
edep['deprel'] =re.sub(r'^obl:jestli(?::gen)?$', r'obl:gen', edep['deprel']) # nevím, jestli osmého nebo devátého září
375
-
# Removing 'až' must be done early. The remainder may be 'počátek'
376
-
# and we will want to convert it to 'počátkem:gen'.
ifre.fullmatch(r'do(?::gen)?', cdeprel): # od nevidím do nevidím ###!!! Ale měli bychom opravit i závislost v základním stromu!
387
+
bdeprel='obl'
388
+
cdeprel='do:gen'
389
+
elifre.fullmatch(r'k(?::dat)?', cdeprel): ###!!! Ale měli bychom opravit i závislost v základním stromu!
390
+
bdeprel='obl'
391
+
cdeprel='k:dat'
392
+
elifre.fullmatch(r'místo(?::gen)?', cdeprel): # 'v poslední době se množí bysem místo bych'
393
+
bdeprel='obl'
394
+
cdeprel='místo:gen'
395
+
elifre.fullmatch(r'od(?::gen)?', cdeprel): # od nevidím do nevidím ###!!! Ale měli bychom opravit i závislost v základním stromu!
396
+
bdeprel='obl'
397
+
cdeprel='od:gen'
398
+
elifre.fullmatch(r'podle(?::gen)?', cdeprel):
399
+
bdeprel='obl'
400
+
cdeprel='podle:gen'
401
+
elifre.fullmatch(r's(?::ins)?', cdeprel): ###!!! "seděli jsme tam s Člověče, nezlob se!" Měla by se opravit konverze stromu.
402
+
bdeprel='obl'
403
+
cdeprel='s:ins'
404
+
elifre.fullmatch(r'v_duchu?(?::gen)?', cdeprel):
405
+
bdeprel='obl'
406
+
cdeprel='v_duchu:gen'
407
+
elifre.fullmatch(r'v', cdeprel):
408
+
bdeprel='obl'
409
+
cdeprel='v:loc'
410
+
# byl by pro, abychom... ###!!! Opravit i konverzi stromu.
411
+
elifre.fullmatch(r'pro(?::acc)?', cdeprel):
412
+
cdeprel='aby'
413
+
elifre.match(r'acl', bdeprel):
414
+
# The following acl should in fact be nmod.
415
+
ifre.fullmatch(r'k(?::dat)?', cdeprel):
416
+
bdeprel='nmod'
417
+
cdeprel='k:dat'
418
+
elifre.fullmatch(r'na_způsob(?::gen)?', cdeprel): # 'střídmost na způsob Masarykova "jez dopolosyta"'
419
+
bdeprel='nmod'
420
+
cdeprel='na_způsob:gen'
421
+
elifre.fullmatch(r'od(?::gen)?', cdeprel):
422
+
bdeprel='nmod'
423
+
cdeprel='od:gen'
424
+
elifre.fullmatch(r'v', cdeprel):
425
+
bdeprel='nmod'
426
+
cdeprel='v:loc'
427
+
else: # bdeprel is 'obl' or 'nmod'
428
+
# The following subordinators should be removed if they occur with nominals.
429
+
ifre.match(r'(ačkoli|když)', cdeprel): # nadějí když ne na zbohatnutí, tak alespoň na dobrou obživu ###!!! perhaps "když" or "když ne" should be analyzed as "cc" here!
430
+
cdeprel=''
431
+
# Removing 'až' must be done early. The remainder may be 'počátek'
432
+
# and we will want to convert it to 'počátkem:gen'.
0 commit comments