epicyon/filters.py

__filename__ = "filters.py"
__author__ = "Bob Mottram"
__license__ = "AGPL3+"
__version__ = "1.1.0"
__maintainer__ = "Bob Mottram"
__email__ = "bob@freedombone.net"
__status__ = "Production"

import os


def addFilter(baseDir: str, nickname: str, domain: str, words: str) -> bool:
    """Adds a filter for particular words within the content of a incoming posts
    """
    filtersFilename = baseDir + '/accounts/' + \
        nickname + '@' + domain + '/filters.txt'
    if os.path.isfile(filtersFilename):
        if words in open(filtersFilename).read():
            return False
    filtersFile = open(filtersFilename, "a+")
    filtersFile.write(words + '\n')
    filtersFile.close()
    return True


def removeFilter(baseDir: str, nickname: str, domain: str,
                 words: str) -> bool:
    """Removes a word filter
    """
    filtersFilename = baseDir + '/accounts/' + \
        nickname + '@' + domain + '/filters.txt'
    if os.path.isfile(filtersFilename):
        if words in open(filtersFilename).read():
            with open(filtersFilename, 'r') as fp:
                with open(filtersFilename + '.new', 'w') as fpnew:
                    for line in fp:
                        line = line.replace('\n', '')
                        if line != words:
                            fpnew.write(line + '\n')
            if os.path.isfile(filtersFilename + '.new'):
                os.rename(filtersFilename + '.new', filtersFilename)
                return True
    return False


def isTwitterPost(content: str) -> bool:
    """Returns true if the given post content is a retweet or twitter crosspost
    """
    if '/twitter.' in content or '@twitter.' in content:
        return True
    elif '>RT <' in content:
        return True
    return False


def isFiltered(baseDir: str, nickname: str, domain: str, content: str) -> bool:
    """Should the given content be filtered out?
    This is a simple type of filter which just matches words, not a regex
    You can add individual words or use word1+word2 to indicate that two
    words must be present although not necessarily adjacent
    """
    # optionally remove retweets
    removeTwitter = baseDir + '/accounts/' + \
        nickname + '@' + domain + '/.removeTwitter'
    if os.path.isfile(removeTwitter):
        if isTwitterPost(content):
            return True

    filtersFilename = baseDir + '/accounts/' + \
        nickname + '@' + domain + '/filters.txt'
    if os.path.isfile(filtersFilename):
        with open(filtersFilename, 'r') as fp:
            for line in fp:
                filterStr = line.replace('\n', '')
                if '+' not in filterStr:
                    if filterStr in content:
                        return True
                else:
                    filterWords = filterStr.replace('"', '').split('+')
                    for word in filterWords:
                        if word not in content:
                            return False
                    return True
    return False
flake8 format 2020-04-03 10:11:54 +00:00			`__filename__ = "filters.py"`
			`__author__ = "Bob Mottram"`
			`__license__ = "AGPL3+"`
			`__version__ = "1.1.0"`
			`__maintainer__ = "Bob Mottram"`
			`__email__ = "bob@freedombone.net"`
			`__status__ = "Production"`
Word filters 2019-07-14 20:50:27 +00:00
			`import os`

flake8 format 2020-04-03 10:11:54 +00:00
			`def addFilter(baseDir: str, nickname: str, domain: str, words: str) -> bool:`
Word filters 2019-07-14 20:50:27 +00:00			`"""Adds a filter for particular words within the content of a incoming posts`
			`"""`
flake8 format 2020-04-03 10:11:54 +00:00			`filtersFilename = baseDir + '/accounts/' + \`
			`nickname + '@' + domain + '/filters.txt'`
Word filters 2019-07-14 20:50:27 +00:00			`if os.path.isfile(filtersFilename):`
			`if words in open(filtersFilename).read():`
			`return False`
flake8 format 2020-04-03 10:11:54 +00:00			`filtersFile = open(filtersFilename, "a+")`
			`filtersFile.write(words + '\n')`
Word filters 2019-07-14 20:50:27 +00:00			`filtersFile.close()`
			`return True`

flake8 format 2020-04-03 10:11:54 +00:00
			`def removeFilter(baseDir: str, nickname: str, domain: str,`
Word filters 2019-07-14 20:50:27 +00:00			`words: str) -> bool:`
			`"""Removes a word filter`
			`"""`
flake8 format 2020-04-03 10:11:54 +00:00			`filtersFilename = baseDir + '/accounts/' + \`
			`nickname + '@' + domain + '/filters.txt'`
Word filters 2019-07-14 20:50:27 +00:00			`if os.path.isfile(filtersFilename):`
			`if words in open(filtersFilename).read():`
			`with open(filtersFilename, 'r') as fp:`
flake8 format 2020-04-03 10:11:54 +00:00			`with open(filtersFilename + '.new', 'w') as fpnew:`
Word filters 2019-07-14 20:50:27 +00:00			`for line in fp:`
flake8 format 2020-04-03 10:11:54 +00:00			`line = line.replace('\n', '')`
			`if line != words:`
			`fpnew.write(line + '\n')`
			`if os.path.isfile(filtersFilename + '.new'):`
			`os.rename(filtersFilename + '.new', filtersFilename)`
Word filters 2019-07-14 20:50:27 +00:00			`return True`
			`return False`
Optionally remove twitter crossposts 2020-02-05 14:57:10 +00:00
flake8 format 2020-04-03 10:11:54 +00:00
Optionally remove twitter crossposts 2020-02-05 14:57:10 +00:00			`def isTwitterPost(content: str) -> bool:`
			`"""Returns true if the given post content is a retweet or twitter crosspost`
			`"""`
More generic twitter post detection 2020-02-05 16:56:45 +00:00			`if '/twitter.' in content or '@twitter.' in content:`
Optionally remove twitter crossposts 2020-02-05 14:57:10 +00:00			`return True`
More generic twitter post detection 2020-02-05 16:56:45 +00:00			`elif '>RT <' in content:`
Optionally remove twitter crossposts 2020-02-05 14:57:10 +00:00			`return True`
			`return False`

flake8 format 2020-04-03 10:11:54 +00:00
			`def isFiltered(baseDir: str, nickname: str, domain: str, content: str) -> bool:`
Word filters 2019-07-14 20:50:27 +00:00			`"""Should the given content be filtered out?`
			`This is a simple type of filter which just matches words, not a regex`
			`You can add individual words or use word1+word2 to indicate that two`
			`words must be present although not necessarily adjacent`
			`"""`
Optionally remove twitter crossposts 2020-02-05 14:57:10 +00:00			`# optionally remove retweets`
flake8 format 2020-04-03 10:11:54 +00:00			`removeTwitter = baseDir + '/accounts/' + \`
			`nickname + '@' + domain + '/.removeTwitter'`
Optionally remove twitter crossposts 2020-02-05 14:57:10 +00:00			`if os.path.isfile(removeTwitter):`
			`if isTwitterPost(content):`
			`return True`

flake8 format 2020-04-03 10:11:54 +00:00			`filtersFilename = baseDir + '/accounts/' + \`
			`nickname + '@' + domain + '/filters.txt'`
Word filters 2019-07-14 20:50:27 +00:00			`if os.path.isfile(filtersFilename):`
			`with open(filtersFilename, 'r') as fp:`
			`for line in fp:`
flake8 format 2020-04-03 10:11:54 +00:00			`filterStr = line.replace('\n', '')`
Word filters 2019-07-14 20:50:27 +00:00			`if '+' not in filterStr:`
			`if filterStr in content:`
			`return True`
			`else:`
flake8 format 2020-04-03 10:11:54 +00:00			`filterWords = filterStr.replace('"', '').split('+')`
Word filters 2019-07-14 20:50:27 +00:00			`for word in filterWords:`
flake8 format 2020-04-03 10:11:54 +00:00			`if word not in content:`
Word filters 2019-07-14 20:50:27 +00:00			`return False`
			`return True`
			`return False`