epicyon/content.py

__filename__ = "content.py"
__author__ = "Bob Mottram"
__license__ = "AGPL3+"
__version__ = "0.0.1"
__maintainer__ = "Bob Mottram"
__email__ = "bob@freedombone.net"
__status__ = "Production"

import os
import commentjson

def addMention(wordStr: str,httpPrefix: str,following: str,replaceMentions: {},recipients: []) -> bool:
    """Detects mentions and adds them to the replacements dict and recipients list
    """
    if not wordStr.startswith('@'):
        return False
    if len(wordStr)<2:
        return False
    possibleHandle=wordStr[1:]
    if '@' not in possibleHandle:
        return False
    replaceFound=False
    possibleNickname=possibleHandle.split('@')[0]
    possibleDomain=possibleHandle.split('@')[1]
    for follow in following:
        if follow.replace('\n','')==possibleHandle:
            recipientActor=httpPrefix+"://"+possibleDomain+"/users/"+possibleNickname
            if recipientActor not in recipients:
                recipients.append(recipientActor)
            replaceMentions[wordStr]="<span class=\"h-card\"><a href=\""+httpPrefix+"://"+possibleDomain+"/@"+possibleNickname+"\" class=\"u-url mention\">@<span>"+possibleNickname+"</span></a></span>"
            replaceFound=True
            break
        if not replaceFound:
            # fall back to a best effort match if an exact one is not found
            for follow in following:
                if follow.startswith(possibleNickname+'@'):
                    replaceDomain=follow.replace('\n','').split('@')[1]
                    recipientActor=httpPrefix+"://"+replaceDomain+"/users/"+possibleNickname
                    if recipientActor not in recipients:
                        recipients.append(recipientActor)
                    replaceMentions[wordStr]="<span class=\"h-card\"><a href=\""+httpPrefix+"://"+replaceDomain+"/@"+possibleNickname+"\" class=\"u-url mention\">@<span>"+possibleNickname+"</span></a></span>"
                    replaceFound=True
                    break
    return replaceFound

def addHtmlTags(baseDir: str,httpPrefix: str, \
                nickname: str,domain: str,content: str, \
                recipients: []) -> str:
    """ Replaces plaintext mentions such as @nick@domain into html
    by matching against known following accounts
    """
    if content.startswith('<p>'):
        return content
    wordsOnly=content.replace(',',' ').replace(';',' ').replace('.',' ').replace(':',' ')
    words=wordsOnly.split(' ')
    replaceMentions={}
    if ':' in domain:
        domain=domain.split(':')[0]
    followingFilename=baseDir+'/accounts/'+nickname+'@'+domain+'/following.txt'
    if not os.path.isfile(followingFilename):
        content=content.replace('\n','</p><p>')
        content='<p>'+content+'</p>'
        return content.replace('<p></p>','')

    # read the following list so that we can detect just @nick
    # in addition to @nick@domain
    with open(followingFilename, "r") as f:
        following = f.readlines()

    # extract mentions and tags from words
    for wordStr in words:
        if addMention(wordStr,httpPrefix,following,replaceMentions,recipients):
            continue

    # replace words with their html versions
    for wordStr,replaceStr in replaceMentions.items():
        content=content.replace(wordStr,replaceStr)
    content=content.replace('\n','</p><p>')
    return '<p>'+content+'</p>'
                
def getMentionsFromHtml(htmlText: str,matchStr="<span class=\"h-card\"><a href=\"") -> []:
    """Extracts mentioned actors from the given html content string
    """
    mentions=[]
    if matchStr not in htmlText:
        return mentions
    mentionsList=htmlText.split(matchStr)
    for mentionStr in mentionsList:
        if '"' not in mentionStr:
            continue
        actorStr=mentionStr.split('"')[0]
        if actorStr.startswith('http') or \
           actorStr.startswith('dat:'):
            mentions.append(actorStr)
    return mentions
mentions function 2019-07-15 14:11:31 +00:00			`__filename__ = "content.py"`
			`__author__ = "Bob Mottram"`
			`__license__ = "AGPL3+"`
			`__version__ = "0.0.1"`
			`__maintainer__ = "Bob Mottram"`
			`__email__ = "bob@freedombone.net"`
			`__status__ = "Production"`

			`import os`
			`import commentjson`

Refactor mentions replacements 2019-08-09 09:09:21 +00:00			`def addMention(wordStr: str,httpPrefix: str,following: str,replaceMentions: {},recipients: []) -> bool:`
			`"""Detects mentions and adds them to the replacements dict and recipients list`
			`"""`
			`if not wordStr.startswith('@'):`
			`return False`
			`if len(wordStr)<2:`
			`return False`
			`possibleHandle=wordStr[1:]`
			`if '@' not in possibleHandle:`
			`return False`
			`replaceFound=False`
			`possibleNickname=possibleHandle.split('@')[0]`
			`possibleDomain=possibleHandle.split('@')[1]`
			`for follow in following:`
			`if follow.replace('\n','')==possibleHandle:`
			`recipientActor=httpPrefix+"://"+possibleDomain+"/users/"+possibleNickname`
			`if recipientActor not in recipients:`
			`recipients.append(recipientActor)`
			`replaceMentions[wordStr]="<span class=\"h-card\"><a href=\""+httpPrefix+"://"+possibleDomain+"/@"+possibleNickname+"\" class=\"u-url mention\">@<span>"+possibleNickname+"</span></a></span>"`
			`replaceFound=True`
			`break`
			`if not replaceFound:`
			`# fall back to a best effort match if an exact one is not found`
			`for follow in following:`
			`if follow.startswith(possibleNickname+'@'):`
			`replaceDomain=follow.replace('\n','').split('@')[1]`
			`recipientActor=httpPrefix+"://"+replaceDomain+"/users/"+possibleNickname`
			`if recipientActor not in recipients:`
			`recipients.append(recipientActor)`
			`replaceMentions[wordStr]="<span class=\"h-card\"><a href=\""+httpPrefix+"://"+replaceDomain+"/@"+possibleNickname+"\" class=\"u-url mention\">@<span>"+possibleNickname+"</span></a></span>"`
			`replaceFound=True`
			`break`
			`return replaceFound`

			`def addHtmlTags(baseDir: str,httpPrefix: str, \`
Also send to mentioned recipients 2019-08-05 16:56:32 +00:00			`nickname: str,domain: str,content: str, \`
			`recipients: []) -> str:`
mentions function 2019-07-15 14:11:31 +00:00			`""" Replaces plaintext mentions such as @nick@domain into html`
			`by matching against known following accounts`
			`"""`
			`if content.startswith('<p>'):`
			`return content`
			`wordsOnly=content.replace(',',' ').replace(';',' ').replace('.',' ').replace(':',' ')`
			`words=wordsOnly.split(' ')`
			`replaceMentions={}`
Handle domains with ports 2019-07-15 14:24:33 +00:00			`if ':' in domain:`
			`domain=domain.split(':')[0]`
mentions function 2019-07-15 14:11:31 +00:00			`followingFilename=baseDir+'/accounts/'+nickname+'@'+domain+'/following.txt'`
			`if not os.path.isfile(followingFilename):`
paragraph 2019-07-15 14:30:38 +00:00			`content=content.replace('\n','</p><p>')`
			`content='<p>'+content+'</p>'`
			`return content.replace('<p></p>','')`
Refactor mentions replacements 2019-08-09 09:09:21 +00:00
			`# read the following list so that we can detect just @nick`
			`# in addition to @nick@domain`
mentions function 2019-07-15 14:11:31 +00:00			`with open(followingFilename, "r") as f:`
			`following = f.readlines()`
Refactor mentions replacements 2019-08-09 09:09:21 +00:00
			`# extract mentions and tags from words`
mentions function 2019-07-15 14:11:31 +00:00			`for wordStr in words:`
Refactor mentions replacements 2019-08-09 09:09:21 +00:00			`if addMention(wordStr,httpPrefix,following,replaceMentions,recipients):`
			`continue`

			`# replace words with their html versions`
mentions function 2019-07-15 14:11:31 +00:00			`for wordStr,replaceStr in replaceMentions.items():`
			`content=content.replace(wordStr,replaceStr)`
			`content=content.replace('\n','</p><p>')`
			`return '<p>'+content+'</p>'`

Include mentions in new posts 2019-08-05 19:13:15 +00:00			`def getMentionsFromHtml(htmlText: str,matchStr="<span class=\"h-card\"><a href=\"") -> []:`
			`"""Extracts mentioned actors from the given html content string`
			`"""`
			`mentions=[]`
			`if matchStr not in htmlText:`
			`return mentions`
Variable name 2019-08-05 19:20:13 +00:00			`mentionsList=htmlText.split(matchStr)`
Include mentions in new posts 2019-08-05 19:13:15 +00:00			`for mentionStr in mentionsList:`
			`if '"' not in mentionStr:`
			`continue`
			`actorStr=mentionStr.split('"')[0]`
			`if actorStr.startswith('http') or \`
			`actorStr.startswith('dat:'):`
			`mentions.append(actorStr)`
			`return mentions`