epicyon/languages.py

__filename__ = "languages.py"
__author__ = "Bob Mottram"
__license__ = "AGPL3+"
__version__ = "1.3.0"
__maintainer__ = "Bob Mottram"
__email__ = "bob@libreserver.org"
__status__ = "Production"
__module_group__ = "Core"

import json
from urllib import request, parse
from utils import get_actor_languages_list
from utils import remove_html
from utils import has_object_dict
from utils import get_config_param
from utils import local_actor_url
from cache import get_person_from_cache


def get_actor_languages(actor_json: {}) -> str:
    """Returns a string containing languages used by the given actor
    """
    lang_list = get_actor_languages_list(actor_json)
    if not lang_list:
        return ''
    languages_str = ''
    for lang in lang_list:
        if languages_str:
            languages_str += ' / ' + lang
        else:
            languages_str = lang
    return languages_str


def get_understood_languages(base_dir: str, http_prefix: str,
                             nickname: str, domain_full: str,
                             person_cache: {}) -> []:
    """Returns a list of understood languages for the given account
    """
    person_url = local_actor_url(http_prefix, nickname, domain_full)
    actor_json = \
        get_person_from_cache(base_dir, person_url, person_cache)
    if not actor_json:
        print('WARN: unable to load actor to obtain languages ' + person_url)
        return []
    return get_actor_languages_list(actor_json)


def set_actor_languages(actor_json: {}, languages_str: str) -> None:
    """Sets the languages understood by the given actor
    """
    languages_str = languages_str.strip()
    separator = None
    possible_separators = (',', '/', ';', '+', ' ')
    for poss in possible_separators:
        if poss in languages_str:
            separator = poss
            break
    if separator:
        lang_list = languages_str.lower().split(separator)
    else:
        lang_list = [languages_str.lower()]
    lang_list2 = ''
    for lang in lang_list:
        lang = lang.strip()
        if lang_list2:
            if ' ' + lang not in lang_list2:
                lang_list2 += ', ' + lang
        else:
            lang_list2 += lang

    # remove any existing value
    property_found = None
    for property_value in actor_json['attachment']:
        name_value = None
        if property_value.get('name'):
            name_value = property_value['name']
        elif property_value.get('schema:name'):
            name_value = property_value['schema:name']
        if not name_value:
            continue
        if not property_value.get('type'):
            continue
        if not name_value.lower().startswith('languages'):
            continue
        property_found = property_value
        break
    if property_found:
        actor_json['attachment'].remove(property_found)

    if not lang_list2:
        return

    new_languages = {
        "name": "Languages",
        "type": "PropertyValue",
        "value": lang_list2
    }
    actor_json['attachment'].append(new_languages)


def understood_post_language(base_dir: str, nickname: str, domain: str,
                             message_json: {}, system_language: str,
                             http_prefix: str, domain_full: str,
                             person_cache: {}) -> bool:
    """Returns true if the post is written in a language
    understood by this account
    """
    msg_object = message_json
    if has_object_dict(message_json):
        msg_object = message_json['object']
    if not msg_object.get('contentMap'):
        return True
    if not isinstance(msg_object['contentMap'], dict):
        return True
    if msg_object['contentMap'].get(system_language):
        return True
    person_url = local_actor_url(http_prefix, nickname, domain_full)
    actor_json = \
        get_person_from_cache(base_dir, person_url, person_cache)
    if not actor_json:
        print('WARN: unable to load actor to check languages ' + person_url)
        return False
    languages_understood = get_actor_languages_list(actor_json)
    if not languages_understood:
        return True
    for lang in languages_understood:
        if msg_object['contentMap'].get(lang):
            return True
    # is the language for this post supported by libretranslate?
    libretranslate_url = get_config_param(base_dir, "libretranslateUrl")
    if libretranslate_url:
        libretranslate_api_key = \
            get_config_param(base_dir, "libretranslateApiKey")
        lang_list = \
            libretranslate_languages(libretranslate_url,
                                     libretranslate_api_key)
        for lang in lang_list:
            if msg_object['contentMap'].get(lang):
                return True
    return False


def libretranslate_languages(url: str, api_key: str = None) -> []:
    """Returns a list of supported languages
    """
    if not url:
        return []
    if not url.endswith('/languages'):
        if not url.endswith('/'):
            url += "/languages"
        else:
            url += "languages"

    params = {}

    if api_key:
        params["api_key"] = api_key

    url_params = parse.urlencode(params)

    req = request.Request(url, data=url_params.encode())

    response_str = ''
    with request.urlopen(req) as response:
        response_str = response.read().decode()

    result = json.loads(response_str)
    if not result:
        return []
    if not isinstance(result, list):
        return []

    lang_list = []
    for lang in result:
        if not isinstance(lang, dict):
            continue
        if not lang.get('code'):
            continue
        lang_code = lang['code']
        if len(lang_code) != 2:
            continue
        lang_list.append(lang_code)
    lang_list.sort()
    return lang_list


def get_links_from_content(content: str) -> {}:
    """Returns a list of links within the given content
    """
    if '<a href' not in content:
        return {}
    sections = content.split('<a href')
    first = True
    links = {}
    for subsection in sections:
        if first:
            first = False
            continue
        if '"' not in subsection:
            continue
        url = subsection.split('"')[1].strip()
        if '://' in url and '.' in url and \
           '>' in subsection:
            if url not in links:
                link_text = subsection.split('>')[1]
                if '<' in link_text:
                    link_text = link_text.split('<')[0]
                    links[link_text] = url
    return links


def add_links_to_content(content: str, links: {}) -> str:
    """Adds links back into plain text
    """
    for link_text, url in links.items():
        url_desc = url
        if link_text.startswith('@') and link_text in content:
            content = \
                content.replace(link_text,
                                '<a href="' + url +
                                '" rel="nofollow noopener ' +
                                'noreferrer" target="_blank">' +
                                link_text + '</a>')
        else:
            if len(url_desc) > 40:
                url_desc = url_desc[:40]
            content += \
                '<p><a href="' + url + \
                '" rel="nofollow noopener noreferrer" target="_blank">' + \
                url_desc + '</a></p>'
    return content


def libretranslate(url: str, text: str,
                   source: str, target: str, api_key: str = None) -> str:
    """Translate string using libretranslate
    """
    if not url:
        return None

    if not url.endswith('/translate'):
        if not url.endswith('/'):
            url += "/translate"
        else:
            url += "translate"

    original_text = text

    # get any links from the text
    links = get_links_from_content(text)

    # LibreTranslate doesn't like markup
    text = remove_html(text)

    # remove any links from plain text version of the content
    for _, url2 in links.items():
        text = text.replace(url2, '')

    lt_params = {
        "q": text,
        "source": source,
        "target": target
    }

    if api_key:
        lt_params["api_key"] = api_key

    url_params = parse.urlencode(lt_params)

    req = request.Request(url, data=url_params.encode())
    response_str = None
    try:
        with request.urlopen(req) as response:
            response_str = response.read().decode()
    except BaseException as ex:
        print('EX: Unable to translate: ' + text + ' ' + str(ex))
        return original_text

    if not response_str:
        return original_text

    translated_text = \
        '<p>' + json.loads(response_str)['translatedText'] + '</p>'

    # append links form the original text
    if links:
        translated_text = add_links_to_content(translated_text, links)
    return translated_text


def auto_translate_post(base_dir: str, post_json_object: {},
                        system_language: str, translate: {}) -> str:
    """Tries to automatically translate the given post
    """
    if not has_object_dict(post_json_object):
        return ''
    msg_object = post_json_object['object']
    if not msg_object.get('contentMap'):
        return ''
    if not isinstance(msg_object['contentMap'], dict):
        return ''

    # is the language for this post supported by libretranslate?
    libretranslate_url = get_config_param(base_dir, "libretranslateUrl")
    if not libretranslate_url:
        return ''
    libretranslate_api_key = get_config_param(base_dir, "libretranslateApiKey")
    lang_list = \
        libretranslate_languages(libretranslate_url, libretranslate_api_key)
    for lang in lang_list:
        content = None
        if msg_object['contentMap'].get(lang):
            content = msg_object['contentMap'][lang]
        if not content:
            continue
        translated_text = \
            libretranslate(libretranslate_url, content,
                           lang, system_language,
                           libretranslate_api_key)
        if translated_text:
            if remove_html(translated_text) == remove_html(content):
                return content
            translated_text = \
                '<p>' + translate['Translated'].upper() + '</p>' + \
                translated_text
        return translated_text
    return ''
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`__filename__ = "languages.py"`
			`__author__ = "Bob Mottram"`
			`__license__ = "AGPL3+"`
Version 1.3.0 2022-02-03 13:58:20 +00:00			`__version__ = "1.3.0"`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`__maintainer__ = "Bob Mottram"`
Change domain to libreserver.org 2021-09-10 16:14:50 +00:00			`__email__ = "bob@libreserver.org"`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`__status__ = "Production"`
			`__module_group__ = "Core"`

Support for libretranslate 2021-07-19 19:40:04 +00:00			`import json`
			`from urllib import request, parse`
Snake case 2021-12-26 10:22:19 +00:00			`from utils import get_actor_languages_list`
Snake case 2021-12-27 15:43:22 +00:00			`from utils import remove_html`
Snake case 2021-12-26 10:57:03 +00:00			`from utils import has_object_dict`
Snake case 2021-12-26 14:08:58 +00:00			`from utils import get_config_param`
Snake case 2021-12-26 10:19:59 +00:00			`from utils import local_actor_url`
Moving to snake case 2021-12-29 21:55:09 +00:00			`from cache import get_person_from_cache`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00

Moving to snake case 2021-12-29 21:55:09 +00:00			`def get_actor_languages(actor_json: {}) -> str:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`"""Returns a string containing languages used by the given actor`
			`"""`
Snake case 2021-12-26 10:35:37 +00:00			`lang_list = get_actor_languages_list(actor_json)`
			`if not lang_list:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return ''`
Snake case 2022-01-02 21:27:49 +00:00			`languages_str = ''`
Snake case 2021-12-26 10:35:37 +00:00			`for lang in lang_list:`
Snake case 2022-01-02 21:27:49 +00:00			`if languages_str:`
			`languages_str += ' / ' + lang`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`else:`
Snake case 2022-01-02 21:27:49 +00:00			`languages_str = lang`
			`return languages_str`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00

Get understood languages for actor making new post 2022-01-28 11:29:01 +00:00			`def get_understood_languages(base_dir: str, http_prefix: str,`
			`nickname: str, domain_full: str,`
			`person_cache: {}) -> []:`
			`"""Returns a list of understood languages for the given account`
			`"""`
			`person_url = local_actor_url(http_prefix, nickname, domain_full)`
			`actor_json = \`
Tidying 2022-06-09 16:54:44 +00:00			`get_person_from_cache(base_dir, person_url, person_cache)`
Get understood languages for actor making new post 2022-01-28 11:29:01 +00:00			`if not actor_json:`
			`print('WARN: unable to load actor to obtain languages ' + person_url)`
			`return []`
			`return get_actor_languages_list(actor_json)`


Use appropriate session to send follow rejects 2022-06-01 14:26:50 +00:00			`def set_actor_languages(actor_json: {}, languages_str: str) -> None:`
Don't require understood languages to be in the translations list 2022-02-26 13:41:48 +00:00			`"""Sets the languages understood by the given actor`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`"""`
Handle input for single understood language 2022-02-25 15:13:23 +00:00			`languages_str = languages_str.strip()`
			`separator = None`
Tidying 2022-02-26 13:47:33 +00:00			`possible_separators = (',', '/', ';', '+', ' ')`
			`for poss in possible_separators:`
			`if poss in languages_str:`
			`separator = poss`
			`break`
Handle input for single understood language 2022-02-25 15:13:23 +00:00			`if separator:`
			`lang_list = languages_str.lower().split(separator)`
			`else:`
			`lang_list = [languages_str.lower()]`
Snake case 2021-12-26 10:35:37 +00:00			`lang_list2 = ''`
			`for lang in lang_list:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`lang = lang.strip()`
Don't require understood languages to be in the translations list 2022-02-26 13:41:48 +00:00			`if lang_list2:`
			`if ' ' + lang not in lang_list2:`
Excessive strip 2022-02-26 13:43:27 +00:00			`lang_list2 += ', ' + lang`
Don't require understood languages to be in the translations list 2022-02-26 13:41:48 +00:00			`else:`
Excessive strip 2022-02-26 13:43:27 +00:00			`lang_list2 += lang`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00
			`# remove any existing value`
Snake case 2022-01-02 21:27:49 +00:00			`property_found = None`
Snake case 2021-12-26 10:32:45 +00:00			`for property_value in actor_json['attachment']:`
Prepare for alternative property names 2022-05-11 16:10:38 +00:00			`name_value = None`
			`if property_value.get('name'):`
			`name_value = property_value['name']`
			`elif property_value.get('schema:name'):`
			`name_value = property_value['schema:name']`
			`if not name_value:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`continue`
Snake case 2021-12-26 10:32:45 +00:00			`if not property_value.get('type'):`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`continue`
Prepare for alternative property names 2022-05-11 16:10:38 +00:00			`if not name_value.lower().startswith('languages'):`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`continue`
Snake case 2022-01-02 21:27:49 +00:00			`property_found = property_value`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`break`
Snake case 2022-01-02 21:27:49 +00:00			`if property_found:`
			`actor_json['attachment'].remove(property_found)`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00
Snake case 2021-12-26 10:35:37 +00:00			`if not lang_list2:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return`

Snake case 2022-01-02 21:27:49 +00:00			`new_languages = {`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`"name": "Languages",`
			`"type": "PropertyValue",`
Snake case 2021-12-26 10:35:37 +00:00			`"value": lang_list2`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`}`
Snake case 2022-01-02 21:27:49 +00:00			`actor_json['attachment'].append(new_languages)`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00

Moving to snake case 2021-12-29 21:55:09 +00:00			`def understood_post_language(base_dir: str, nickname: str, domain: str,`
			`message_json: {}, system_language: str,`
			`http_prefix: str, domain_full: str,`
			`person_cache: {}) -> bool:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`"""Returns true if the post is written in a language`
			`understood by this account`
			`"""`
Snake case 2022-01-02 21:27:49 +00:00			`msg_object = message_json`
Snake case 2021-12-26 10:57:03 +00:00			`if has_object_dict(message_json):`
Snake case 2022-01-02 21:27:49 +00:00			`msg_object = message_json['object']`
			`if not msg_object.get('contentMap'):`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return True`
Snake case 2022-01-02 21:27:49 +00:00			`if not isinstance(msg_object['contentMap'], dict):`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return True`
Snake case 2022-01-02 21:27:49 +00:00			`if msg_object['contentMap'].get(system_language):`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return True`
Snake case 2022-01-02 21:27:49 +00:00			`person_url = local_actor_url(http_prefix, nickname, domain_full)`
Moving to snake case 2021-12-29 21:55:09 +00:00			`actor_json = \`
Tidying 2022-06-09 16:54:44 +00:00			`get_person_from_cache(base_dir, person_url, person_cache)`
Snake case 2021-12-26 10:29:52 +00:00			`if not actor_json:`
Snake case 2022-01-02 21:27:49 +00:00			`print('WARN: unable to load actor to check languages ' + person_url)`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return False`
Snake case 2021-12-26 10:52:54 +00:00			`languages_understood = get_actor_languages_list(actor_json)`
			`if not languages_understood:`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return True`
Snake case 2021-12-26 10:52:54 +00:00			`for lang in languages_understood:`
Snake case 2022-01-02 21:27:49 +00:00			`if msg_object['contentMap'].get(lang):`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return True`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`# is the language for this post supported by libretranslate?`
Snake case 2022-01-02 21:45:26 +00:00			`libretranslate_url = get_config_param(base_dir, "libretranslateUrl")`
Snake case 2022-01-02 21:27:49 +00:00			`if libretranslate_url:`
			`libretranslate_api_key = \`
Snake case 2021-12-26 14:08:58 +00:00			`get_config_param(base_dir, "libretranslateApiKey")`
Snake case 2021-12-26 10:35:37 +00:00			`lang_list = \`
Snake case 2022-01-02 21:27:49 +00:00			`libretranslate_languages(libretranslate_url,`
			`libretranslate_api_key)`
Snake case 2021-12-26 10:35:37 +00:00			`for lang in lang_list:`
Snake case 2022-01-02 21:27:49 +00:00			`if msg_object['contentMap'].get(lang):`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`return True`
Use cached actors when checking understood languages This improves speed by reducing disk reads 2021-07-19 08:46:21 +00:00			`return False`
Support for libretranslate 2021-07-19 19:40:04 +00:00

Snake case 2022-01-02 21:27:49 +00:00			`def libretranslate_languages(url: str, api_key: str = None) -> []:`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`"""Returns a list of supported languages`
			`"""`
Translations for ontology 2021-08-08 11:16:18 +00:00			`if not url:`
			`return []`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`if not url.endswith('/languages'):`
			`if not url.endswith('/'):`
			`url += "/languages"`
			`else:`
			`url += "languages"`

Tidying 2022-05-30 18:33:51 +00:00			`params = {}`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`if api_key:`
			`params["api_key"] = api_key`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`url_params = parse.urlencode(params)`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`req = request.Request(url, data=url_params.encode())`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Tidying 2022-05-30 18:33:51 +00:00			`response_str = ''`
			`with request.urlopen(req) as response:`
			`response_str = response.read().decode()`
Support for libretranslate 2021-07-19 19:40:04 +00:00
			`result = json.loads(response_str)`
			`if not result:`
			`return []`
			`if not isinstance(result, list):`
			`return []`

Snake case 2021-12-26 10:35:37 +00:00			`lang_list = []`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`for lang in result:`
			`if not isinstance(lang, dict):`
			`continue`
			`if not lang.get('code'):`
			`continue`
Snake case 2022-01-02 21:27:49 +00:00			`lang_code = lang['code']`
			`if len(lang_code) != 2:`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`continue`
Snake case 2022-01-02 21:27:49 +00:00			`lang_list.append(lang_code)`
Snake case 2021-12-26 10:35:37 +00:00			`lang_list.sort()`
			`return lang_list`
Support for libretranslate 2021-07-19 19:40:04 +00:00

Moving to snake case 2021-12-29 21:55:09 +00:00			`def get_links_from_content(content: str) -> {}:`
Append links to translated text 2021-07-20 10:45:04 +00:00			`"""Returns a list of links within the given content`
			`"""`
			`if '<a href' not in content:`
replace mentions when automatically translating 2021-07-20 17:49:12 +00:00			`return {}`
Append links to translated text 2021-07-20 10:45:04 +00:00			`sections = content.split('<a href')`
			`first = True`
replace mentions when automatically translating 2021-07-20 17:49:12 +00:00			`links = {}`
Append links to translated text 2021-07-20 10:45:04 +00:00			`for subsection in sections:`
			`if first:`
			`first = False`
			`continue`
			`if '"' not in subsection:`
			`continue`
			`url = subsection.split('"')[1].strip()`
replace mentions when automatically translating 2021-07-20 17:49:12 +00:00			`if '://' in url and '.' in url and \`
			`'>' in subsection:`
Append links to translated text 2021-07-20 10:45:04 +00:00			`if url not in links:`
Snake case 2022-01-02 21:27:49 +00:00			`link_text = subsection.split('>')[1]`
			`if '<' in link_text:`
			`link_text = link_text.split('<')[0]`
			`links[link_text] = url`
Append links to translated text 2021-07-20 10:45:04 +00:00			`return links`


Moving to snake case 2021-12-29 21:55:09 +00:00			`def add_links_to_content(content: str, links: {}) -> str:`
Extra test for mentions 2021-07-20 18:02:42 +00:00			`"""Adds links back into plain text`
			`"""`
Snake case 2022-01-02 21:27:49 +00:00			`for link_text, url in links.items():`
			`url_desc = url`
			`if link_text.startswith('@') and link_text in content:`
Extra test for mentions 2021-07-20 18:02:42 +00:00			`content = \`
Snake case 2022-01-02 21:27:49 +00:00			`content.replace(link_text,`
Extra test for mentions 2021-07-20 18:02:42 +00:00			`'<a href="' + url +`
			`'" rel="nofollow noopener ' +`
			`'noreferrer" target="_blank">' +`
Snake case 2022-01-02 21:27:49 +00:00			`link_text + '</a>')`
Extra test for mentions 2021-07-20 18:02:42 +00:00			`else:`
Snake case 2022-01-02 21:27:49 +00:00			`if len(url_desc) > 40:`
			`url_desc = url_desc[:40]`
Extra test for mentions 2021-07-20 18:02:42 +00:00			`content += \`
			`'<p><a href="' + url + \`
			`'" rel="nofollow noopener noreferrer" target="_blank">' + \`
Snake case 2022-01-02 21:27:49 +00:00			`url_desc + '</a></p>'`
Extra test for mentions 2021-07-20 18:02:42 +00:00			`return content`


Translations for ontology 2021-08-08 11:16:18 +00:00			`def libretranslate(url: str, text: str,`
Snake case 2022-01-02 21:27:49 +00:00			`source: str, target: str, api_key: str = None) -> str:`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`"""Translate string using libretranslate`
			`"""`
Translations for ontology 2021-08-08 11:16:18 +00:00			`if not url:`
			`return None`

Support for libretranslate 2021-07-19 19:40:04 +00:00			`if not url.endswith('/translate'):`
			`if not url.endswith('/'):`
			`url += "/translate"`
			`else:`
			`url += "translate"`

Snake case 2022-01-02 21:27:49 +00:00			`original_text = text`
Tidying 2021-07-20 20:12:24 +00:00
Append links to translated text 2021-07-20 10:45:04 +00:00			`# get any links from the text`
Moving to snake case 2021-12-29 21:55:09 +00:00			`links = get_links_from_content(text)`
Append links to translated text 2021-07-20 10:45:04 +00:00
Remove html prior to automatic translation 2021-07-20 10:13:22 +00:00			`# LibreTranslate doesn't like markup`
Snake case 2021-12-27 15:43:22 +00:00			`text = remove_html(text)`
Remove html prior to automatic translation 2021-07-20 10:13:22 +00:00
Remove links during translation 2021-07-20 20:04:49 +00:00			`# remove any links from plain text version of the content`
Snake case 2022-01-02 21:27:49 +00:00			`for _, url2 in links.items():`
			`text = text.replace(url2, '')`
Remove links during translation 2021-07-20 20:04:49 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`lt_params = {`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`"q": text,`
			`"source": source,`
			`"target": target`
			`}`

Snake case 2022-01-02 21:27:49 +00:00			`if api_key:`
			`lt_params["api_key"] = api_key`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`url_params = parse.urlencode(lt_params)`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`req = request.Request(url, data=url_params.encode())`
Tidying 2022-05-30 18:33:51 +00:00			`response_str = None`
Catch exception 2021-07-20 20:09:39 +00:00			`try:`
Tidying 2022-05-30 18:33:51 +00:00			`with request.urlopen(req) as response:`
			`response_str = response.read().decode()`
			`except BaseException as ex:`
			`print('EX: Unable to translate: ' + text + ' ' + str(ex))`
Snake case 2022-01-02 21:27:49 +00:00			`return original_text`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Tidying 2022-05-30 18:33:51 +00:00			`if not response_str:`
			`return original_text`
Support for libretranslate 2021-07-19 19:40:04 +00:00
Snake case 2022-01-02 21:27:49 +00:00			`translated_text = \`
Append links to translated text 2021-07-20 10:45:04 +00:00			`'<p>' + json.loads(response_str)['translatedText'] + '</p>'`
Link style 2021-07-20 10:46:58 +00:00
			`# append links form the original text`
Append links to translated text 2021-07-20 10:45:04 +00:00			`if links:`
Snake case 2022-01-02 21:27:49 +00:00			`translated_text = add_links_to_content(translated_text, links)`
			`return translated_text`
Support for libretranslate 2021-07-19 19:40:04 +00:00

Moving to snake case 2021-12-29 21:55:09 +00:00			`def auto_translate_post(base_dir: str, post_json_object: {},`
			`system_language: str, translate: {}) -> str:`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`"""Tries to automatically translate the given post`
			`"""`
Snake case 2021-12-26 10:57:03 +00:00			`if not has_object_dict(post_json_object):`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`return ''`
Snake case 2022-01-02 21:27:49 +00:00			`msg_object = post_json_object['object']`
			`if not msg_object.get('contentMap'):`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`return ''`
Snake case 2022-01-02 21:27:49 +00:00			`if not isinstance(msg_object['contentMap'], dict):`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`return ''`

			`# is the language for this post supported by libretranslate?`
Snake case 2022-01-02 21:27:49 +00:00			`libretranslate_url = get_config_param(base_dir, "libretranslateUrl")`
			`if not libretranslate_url:`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`return ''`
Snake case 2022-01-02 21:27:49 +00:00			`libretranslate_api_key = get_config_param(base_dir, "libretranslateApiKey")`
Snake case 2021-12-26 10:35:37 +00:00			`lang_list = \`
Snake case 2022-01-02 21:27:49 +00:00			`libretranslate_languages(libretranslate_url, libretranslate_api_key)`
Snake case 2021-12-26 10:35:37 +00:00			`for lang in lang_list:`
Remove unused characters before converting post to html 2022-05-09 17:20:05 +00:00			`content = None`
Snake case 2022-01-02 21:27:49 +00:00			`if msg_object['contentMap'].get(lang):`
			`content = msg_object['contentMap'][lang]`
Remove unused characters before converting post to html 2022-05-09 17:20:05 +00:00			`if not content:`
			`continue`
			`translated_text = \`
			`libretranslate(libretranslate_url, content,`
			`lang, system_language,`
			`libretranslate_api_key)`
			`if translated_text:`
			`if remove_html(translated_text) == remove_html(content):`
			`return content`
Snake case 2022-01-02 21:27:49 +00:00			`translated_text = \`
Remove unused characters before converting post to html 2022-05-09 17:20:05 +00:00			`'<p>' + translate['Translated'].upper() + '</p>' + \`
			`translated_text`
			`return translated_text`
Support for libretranslate 2021-07-19 19:40:04 +00:00			`return ''`