mirror of https://gitlab.com/bashrc2/epicyon
Content warnings for military-industrial usa
parent
ad4d30a1bb
commit
ac3b417b62
13
blocking.py
13
blocking.py
|
@ -1791,17 +1791,24 @@ def save_blocked_military(base_dir: str, block_military: {}) -> None:
|
||||||
|
|
||||||
|
|
||||||
def get_mil_domains_list() -> []:
|
def get_mil_domains_list() -> []:
|
||||||
"""returns a list of military top level domains
|
"""returns a list of military domains
|
||||||
"""
|
"""
|
||||||
return ('army', 'navy', 'airforce', 'mil')
|
return ('army', 'navy', 'airforce', 'mil',
|
||||||
|
'sncorp.com', 'sierranevadacorp.us', 'ncontext.com')
|
||||||
|
|
||||||
|
|
||||||
def contains_military_domain(message_str: str) -> bool:
|
def contains_military_domain(message_str: str) -> bool:
|
||||||
"""Returns true if the given string contains a military domain
|
"""Returns true if the given string contains a military domain
|
||||||
"""
|
"""
|
||||||
mil_domains = get_mil_domains_list()
|
mil_domains = get_mil_domains_list()
|
||||||
for tld in mil_domains:
|
for domain_str in mil_domains:
|
||||||
|
if '.' not in domain_str:
|
||||||
|
tld = domain_str
|
||||||
if '.' + tld + '"' in message_str or \
|
if '.' + tld + '"' in message_str or \
|
||||||
'.' + tld + '/' in message_str:
|
'.' + tld + '/' in message_str:
|
||||||
return True
|
return True
|
||||||
|
else:
|
||||||
|
if domain_str + '"' in message_str or \
|
||||||
|
domain_str + '/' in message_str:
|
||||||
|
return True
|
||||||
return False
|
return False
|
||||||
|
|
10
crawlers.py
10
crawlers.py
|
@ -192,8 +192,16 @@ def blocked_user_agent(calling_domain: str, agent_str: str,
|
||||||
# does this account block military domains?
|
# does this account block military domains?
|
||||||
if block_military.get(nickname):
|
if block_military.get(nickname):
|
||||||
mil_domains = get_mil_domains_list()
|
mil_domains = get_mil_domains_list()
|
||||||
for tld in mil_domains:
|
for domain_str in mil_domains:
|
||||||
|
if '.' not in domain_str:
|
||||||
|
tld = domain_str
|
||||||
if agent_domain.endswith('.' + tld):
|
if agent_domain.endswith('.' + tld):
|
||||||
|
blocked_ua = True
|
||||||
|
print('BLOCK: Blocked military tld user agent: ' +
|
||||||
|
agent_domain)
|
||||||
|
break
|
||||||
|
else:
|
||||||
|
if agent_domain.endswith(domain_str):
|
||||||
blocked_ua = True
|
blocked_ua = True
|
||||||
print('BLOCK: Blocked military user agent: ' +
|
print('BLOCK: Blocked military user agent: ' +
|
||||||
agent_domain)
|
agent_domain)
|
||||||
|
|
|
@ -0,0 +1,139 @@
|
||||||
|
{
|
||||||
|
"name": "Military-industrial complex (USA)",
|
||||||
|
"warning": "Military-industrial complex (USA)",
|
||||||
|
"description": "Military contractors in the USA",
|
||||||
|
"words": [],
|
||||||
|
"domains": [
|
||||||
|
"constellis.com",
|
||||||
|
"actiontarget.com",
|
||||||
|
"adt.com",
|
||||||
|
"advanced-armament.com",
|
||||||
|
"aecom.com",
|
||||||
|
"aerospace.org",
|
||||||
|
"avinc.com",
|
||||||
|
"amgeneral.com",
|
||||||
|
"api.org",
|
||||||
|
"argonst.com",
|
||||||
|
"rockwellcollins.com",
|
||||||
|
"artisllc.com",
|
||||||
|
"assettinc.com",
|
||||||
|
"astronautics.com",
|
||||||
|
"aurora.aero",
|
||||||
|
"axon.com",
|
||||||
|
"baesystems.com",
|
||||||
|
"ball.com",
|
||||||
|
"barrett.net",
|
||||||
|
"battelle.org",
|
||||||
|
"bechtel.com",
|
||||||
|
"boeing.com",
|
||||||
|
"boozallen.com",
|
||||||
|
"bostondynamics.com",
|
||||||
|
"caci.com",
|
||||||
|
"carlyle.com",
|
||||||
|
"cmu.edu",
|
||||||
|
"ceradyne.com",
|
||||||
|
"cloudera.com",
|
||||||
|
"columbiagroup.com",
|
||||||
|
"csra.com",
|
||||||
|
"cubic.com",
|
||||||
|
"omegatraining.com",
|
||||||
|
"curtisswright.com",
|
||||||
|
"decibelresearch.com",
|
||||||
|
"draper.com",
|
||||||
|
"leonardodrs.com",
|
||||||
|
"dyn-intl.com",
|
||||||
|
"ewi.org",
|
||||||
|
"elbitsystems.com",
|
||||||
|
"ensco.com",
|
||||||
|
"ey.com",
|
||||||
|
"evergreenaviation.com",
|
||||||
|
"exxonmobil.com",
|
||||||
|
"fluor.com",
|
||||||
|
"gdls.com",
|
||||||
|
"qinetiq-na.com",
|
||||||
|
"fwc.com",
|
||||||
|
"ga.com",
|
||||||
|
"gd.com",
|
||||||
|
"gdbiw.com",
|
||||||
|
"gdeb.com",
|
||||||
|
"gulfstream.com",
|
||||||
|
"ge.com",
|
||||||
|
"halliburton.com",
|
||||||
|
"healthnet.com",
|
||||||
|
"honeywell.com",
|
||||||
|
"humana.com",
|
||||||
|
"hii.com",
|
||||||
|
"hybricon.com",
|
||||||
|
"ibm.com",
|
||||||
|
"insighttechnology.com",
|
||||||
|
"intelsat.com",
|
||||||
|
"irobot.com",
|
||||||
|
"exelisinc.com",
|
||||||
|
"jacobs.com",
|
||||||
|
"jhu.edu",
|
||||||
|
"kaman.com",
|
||||||
|
"kbr.com",
|
||||||
|
"kearfott.com",
|
||||||
|
"knightarmco.com",
|
||||||
|
"kratosdefense.com",
|
||||||
|
"l3harris.com",
|
||||||
|
"rocket.com",
|
||||||
|
"leidos.com",
|
||||||
|
"eotechinc.com",
|
||||||
|
"lmtdefense.com",
|
||||||
|
"lockheedmartin.com",
|
||||||
|
"gyrocamsystems.com",
|
||||||
|
"sikorsky.com",
|
||||||
|
"genasys.com",
|
||||||
|
"mantech.com",
|
||||||
|
"maxar.com",
|
||||||
|
"mcqinc.com",
|
||||||
|
"microsoft.com",
|
||||||
|
"missionessential.com",
|
||||||
|
"motorola.com",
|
||||||
|
"natelems.com",
|
||||||
|
"navistar.com",
|
||||||
|
"nextel.com",
|
||||||
|
"northropgrumman.com",
|
||||||
|
"oceaneering.com",
|
||||||
|
"olin.com",
|
||||||
|
"oshkoshcorp.com",
|
||||||
|
"para-usa.com",
|
||||||
|
"perotsystems.com",
|
||||||
|
"army.mil",
|
||||||
|
"precast.com",
|
||||||
|
"rtx.com",
|
||||||
|
"collinsaerospace.com",
|
||||||
|
"rockwellcollins.com",
|
||||||
|
"goodrich.com",
|
||||||
|
"prattwhitney.com",
|
||||||
|
"raytheonintelligenceandspace.com",
|
||||||
|
"raytheonmissilesanddefense.com",
|
||||||
|
"remington.com",
|
||||||
|
"remarms.com",
|
||||||
|
"ruger.com",
|
||||||
|
"saab.com",
|
||||||
|
"saic.com",
|
||||||
|
"govcio.com",
|
||||||
|
"sncorp.com",
|
||||||
|
"smith-wesson.com",
|
||||||
|
"smithenterprise.com",
|
||||||
|
"sparta.com",
|
||||||
|
"nps.gov",
|
||||||
|
"srcinc.com",
|
||||||
|
"sri.com",
|
||||||
|
"stewartandstevenson.com",
|
||||||
|
"swiftengineering.com",
|
||||||
|
"tacticalairsupport.com",
|
||||||
|
"teledyne.com",
|
||||||
|
"textron.com",
|
||||||
|
"aaicorp.com",
|
||||||
|
"bellflight.com",
|
||||||
|
"trijicon.com",
|
||||||
|
"triwest.com",
|
||||||
|
"unisys.com",
|
||||||
|
"usord.com",
|
||||||
|
"verizon.com",
|
||||||
|
"vinnellarabia.com"
|
||||||
|
]
|
||||||
|
}
|
Loading…
Reference in New Issue