epicyon/daemon_get_hashtag.py

__filename__ = "daemon_get_hashtag.py"
__author__ = "Bob Mottram"
__license__ = "AGPL3+"
__version__ = "1.5.0"
__maintainer__ = "Bob Mottram"
__email__ = "bob@libreserver.org"
__status__ = "Production"
__module_group__ = "Core GET"

import json
import urllib.parse
from session import establish_session
from httpcodes import http_400
from httpcodes import http_404
from httpcodes import write2
from httpheaders import login_headers
from httpheaders import redirect_headers
from httpheaders import set_headers
from blocking import is_blocked_hashtag
from utils import convert_domains
from utils import get_nickname_from_actor
from fitnessFunctions import fitness_performance
from webapp_utils import html_hashtag_blocked
from webapp_search import html_hashtag_search
from webapp_search import hashtag_search_rss
from webapp_search import hashtag_search_json
from webapp_hashtagswarm import get_hashtag_categories_feed


def hashtag_search_rss2(self, calling_domain: str,
                        path: str, cookie: str,
                        base_dir: str, http_prefix: str,
                        domain: str, domain_full: str, port: int,
                        onion_domain: str, i2p_domain: str,
                        getreq_start_time,
                        system_language: str,
                        fitness: {}, debug: bool) -> None:
    """Return an RSS 2 feed for a hashtag
    """
    hashtag = path.split('/tags/rss2/')[1]
    if is_blocked_hashtag(base_dir, hashtag):
        http_400(self)
        return
    nickname = None
    if '/users/' in path:
        actor = \
            http_prefix + '://' + domain_full + path
        nickname = \
            get_nickname_from_actor(actor)
    hashtag_str = \
        hashtag_search_rss(nickname,
                           domain, port,
                           base_dir, hashtag,
                           http_prefix,
                           system_language)
    if hashtag_str:
        msg = hashtag_str.encode('utf-8')
        msglen = len(msg)
        set_headers(self, 'text/xml', msglen,
                    cookie, calling_domain, False)
        write2(self, msg)
    else:
        origin_path_str = path.split('/tags/rss2/')[0]
        origin_path_str_absolute = \
            http_prefix + '://' + domain_full + origin_path_str
        if calling_domain.endswith('.onion') and onion_domain:
            origin_path_str_absolute = \
                'http://' + onion_domain + origin_path_str
        elif (calling_domain.endswith('.i2p') and onion_domain):
            origin_path_str_absolute = \
                'http://' + i2p_domain + origin_path_str
        redirect_headers(self, origin_path_str_absolute + '/search',
                         cookie, calling_domain)
    fitness_performance(getreq_start_time, fitness,
                        '_GET', '_hashtag_search_rss2',
                        debug)


def hashtag_search_json2(self, calling_domain: str,
                         referer_domain: str,
                         path: str, cookie: str,
                         base_dir: str, http_prefix: str,
                         domain: str, domain_full: str, port: int,
                         onion_domain: str, i2p_domain: str,
                         getreq_start_time,
                         max_posts_in_feed: int,
                         fitness: {}, debug: bool) -> None:
    """Return a json collection for a hashtag
    """
    page_number = 1
    if '?page=' in path:
        page_number_str = path.split('?page=')[1]
        if page_number_str.isdigit():
            page_number = int(page_number_str)
        path = path.split('?page=')[0]
    hashtag = path.split('/tags/')[1]
    if is_blocked_hashtag(base_dir, hashtag):
        http_400(self)
        return
    nickname = None
    if '/users/' in path:
        actor = \
            http_prefix + '://' + domain_full + path
        nickname = \
            get_nickname_from_actor(actor)
    hashtag_json = \
        hashtag_search_json(nickname,
                            domain, port,
                            base_dir, hashtag,
                            page_number, max_posts_in_feed,
                            http_prefix)
    if hashtag_json:
        msg_str = json.dumps(hashtag_json)
        msg_str = convert_domains(calling_domain, referer_domain,
                                  msg_str, http_prefix, domain,
                                  onion_domain, i2p_domain)
        msg = msg_str.encode('utf-8')
        msglen = len(msg)
        set_headers(self, 'application/json', msglen,
                    None, calling_domain, True)
        write2(self, msg)
    else:
        origin_path_str = path.split('/tags/')[0]
        origin_path_str_absolute = \
            http_prefix + '://' + domain_full + origin_path_str
        if calling_domain.endswith('.onion') and onion_domain:
            origin_path_str_absolute = \
                'http://' + onion_domain + origin_path_str
        elif (calling_domain.endswith('.i2p') and onion_domain):
            origin_path_str_absolute = \
                'http://' + i2p_domain + origin_path_str
        redirect_headers(self, origin_path_str_absolute,
                         cookie, calling_domain)
    fitness_performance(getreq_start_time, fitness,
                        '_GET', '_hashtag_search_json',
                        debug)


def hashtag_search2(self, calling_domain: str,
                    path: str, cookie: str,
                    base_dir: str, http_prefix: str,
                    domain: str, domain_full: str, port: int,
                    onion_domain: str, i2p_domain: str,
                    getreq_start_time,
                    curr_session,
                    max_posts_in_hashtag_feed: int,
                    translate: {}, account_timezone: {},
                    bold_reading_nicknames: {},
                    fitness: {}, debug: bool,
                    recent_posts_cache: {},
                    max_recent_posts: int,
                    cached_webfingers: {},
                    person_cache: {},
                    project_version: str,
                    yt_replace_domain: str,
                    twitter_replacement_domain: str,
                    show_published_date_only: bool,
                    peertube_instances: [],
                    allow_local_network_access: bool,
                    theme_name: str,
                    system_language: str,
                    max_like_count: int,
                    signing_priv_key_pem: str,
                    cw_lists: {},
                    lists_enabled: {},
                    dogwhistles: {},
                    map_format: str,
                    access_keys: {},
                    min_images_for_accounts: [],
                    buy_sites: [],
                    auto_cw_cache: {}) -> None:
    """Return the result of a hashtag search
    """
    page_number = 1
    if '?page=' in path:
        page_number_str = path.split('?page=')[1]
        if '#' in page_number_str:
            page_number_str = page_number_str.split('#')[0]
        if len(page_number_str) > 5:
            page_number_str = "1"
        if page_number_str.isdigit():
            page_number = int(page_number_str)
    hashtag = path.split('/tags/')[1]
    if '?page=' in hashtag:
        hashtag = hashtag.split('?page=')[0]
    hashtag = urllib.parse.unquote_plus(hashtag)
    if is_blocked_hashtag(base_dir, hashtag):
        print('BLOCK: blocked hashtag #' + hashtag)
        msg = html_hashtag_blocked(base_dir,
                                   translate).encode('utf-8')
        msglen = len(msg)
        login_headers(self, 'text/html', msglen, calling_domain)
        write2(self, msg)
        return
    nickname = None
    if '/users/' in path:
        nickname = path.split('/users/')[1]
        if '/' in nickname:
            nickname = nickname.split('/')[0]
        if '?' in nickname:
            nickname = nickname.split('?')[0]
    timezone = None
    if account_timezone.get(nickname):
        timezone = account_timezone.get(nickname)
    bold_reading = False
    if bold_reading_nicknames.get(nickname):
        bold_reading = True
    hashtag_str = \
        html_hashtag_search(nickname, domain, port,
                            recent_posts_cache,
                            max_recent_posts,
                            translate,
                            base_dir, hashtag, page_number,
                            max_posts_in_hashtag_feed,
                            curr_session,
                            cached_webfingers,
                            person_cache,
                            http_prefix,
                            project_version,
                            yt_replace_domain,
                            twitter_replacement_domain,
                            show_published_date_only,
                            peertube_instances,
                            allow_local_network_access,
                            theme_name,
                            system_language,
                            max_like_count,
                            signing_priv_key_pem,
                            cw_lists,
                            lists_enabled,
                            timezone, bold_reading,
                            dogwhistles,
                            map_format,
                            access_keys,
                            'search',
                            min_images_for_accounts,
                            buy_sites,
                            auto_cw_cache)
    if hashtag_str:
        msg = hashtag_str.encode('utf-8')
        msglen = len(msg)
        set_headers(self, 'text/html', msglen,
                    cookie, calling_domain, False)
        write2(self, msg)
    else:
        origin_path_str = path.split('/tags/')[0]
        origin_path_str_absolute = \
            http_prefix + '://' + domain_full + origin_path_str
        if calling_domain.endswith('.onion') and onion_domain:
            origin_path_str_absolute = \
                'http://' + onion_domain + origin_path_str
        elif (calling_domain.endswith('.i2p') and onion_domain):
            origin_path_str_absolute = \
                'http://' + i2p_domain + origin_path_str
        redirect_headers(self, origin_path_str_absolute + '/search',
                         cookie, calling_domain)
    fitness_performance(getreq_start_time, fitness,
                        '_GET', '_hashtag_search', debug)


def get_hashtag_categories_feed2(self, calling_domain: str, path: str,
                                 base_dir: str, proxy_type: str,
                                 getreq_start_time,
                                 debug: bool,
                                 curr_session) -> None:
    """Returns the hashtag categories feed
    """
    curr_session = \
        establish_session("get_hashtag_categories_feed",
                          curr_session, proxy_type,
                          self.server)
    if not curr_session:
        http_404(self, 27)
        return

    hashtag_categories = None
    msg = \
        get_hashtag_categories_feed(base_dir, hashtag_categories)
    if msg:
        msg = msg.encode('utf-8')
        msglen = len(msg)
        set_headers(self, 'text/xml', msglen,
                    None, calling_domain, True)
        write2(self, msg)
        if debug:
            print('Sent rss2 categories feed: ' +
                  path + ' ' + calling_domain)
        fitness_performance(getreq_start_time, self.server.fitness,
                            '_GET', '_get_hashtag_categories_feed', debug)
        return
    if debug:
        print('Failed to get rss2 categories feed: ' +
              path + ' ' + calling_domain)
    http_404(self, 28)
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`__filename__ = "daemon_get_hashtag.py"`
			`__author__ = "Bob Mottram"`
			`__license__ = "AGPL3+"`
			`__version__ = "1.5.0"`
			`__maintainer__ = "Bob Mottram"`
			`__email__ = "bob@libreserver.org"`
			`__status__ = "Production"`
Update architecture diagrams 2024-03-23 15:11:05 +00:00			`__module_group__ = "Core GET"`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00
			`import json`
			`import urllib.parse`
Move hashtag function 2024-03-02 17:24:29 +00:00			`from session import establish_session`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`from httpcodes import http_400`
Move hashtag function 2024-03-02 17:24:29 +00:00			`from httpcodes import http_404`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`from httpcodes import write2`
			`from httpheaders import login_headers`
			`from httpheaders import redirect_headers`
			`from httpheaders import set_headers`
			`from blocking import is_blocked_hashtag`
			`from utils import convert_domains`
			`from utils import get_nickname_from_actor`
Move hashtag function 2024-03-02 17:24:29 +00:00			`from fitnessFunctions import fitness_performance`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`from webapp_utils import html_hashtag_blocked`
			`from webapp_search import html_hashtag_search`
			`from webapp_search import hashtag_search_rss`
			`from webapp_search import hashtag_search_json`
Move hashtag function 2024-03-02 17:24:29 +00:00			`from webapp_hashtagswarm import get_hashtag_categories_feed`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00

			`def hashtag_search_rss2(self, calling_domain: str,`
			`path: str, cookie: str,`
			`base_dir: str, http_prefix: str,`
			`domain: str, domain_full: str, port: int,`
			`onion_domain: str, i2p_domain: str,`
Tidying 2024-04-11 10:00:00 +00:00			`getreq_start_time,`
			`system_language: str,`
			`fitness: {}, debug: bool) -> None:`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`"""Return an RSS 2 feed for a hashtag`
			`"""`
			`hashtag = path.split('/tags/rss2/')[1]`
			`if is_blocked_hashtag(base_dir, hashtag):`
			`http_400(self)`
			`return`
			`nickname = None`
			`if '/users/' in path:`
			`actor = \`
			`http_prefix + '://' + domain_full + path`
			`nickname = \`
			`get_nickname_from_actor(actor)`
			`hashtag_str = \`
			`hashtag_search_rss(nickname,`
			`domain, port,`
			`base_dir, hashtag,`
			`http_prefix,`
Tidying 2024-04-11 10:00:00 +00:00			`system_language)`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`if hashtag_str:`
			`msg = hashtag_str.encode('utf-8')`
			`msglen = len(msg)`
			`set_headers(self, 'text/xml', msglen,`
			`cookie, calling_domain, False)`
			`write2(self, msg)`
			`else:`
			`origin_path_str = path.split('/tags/rss2/')[0]`
			`origin_path_str_absolute = \`
			`http_prefix + '://' + domain_full + origin_path_str`
			`if calling_domain.endswith('.onion') and onion_domain:`
			`origin_path_str_absolute = \`
			`'http://' + onion_domain + origin_path_str`
			`elif (calling_domain.endswith('.i2p') and onion_domain):`
			`origin_path_str_absolute = \`
			`'http://' + i2p_domain + origin_path_str`
			`redirect_headers(self, origin_path_str_absolute + '/search',`
			`cookie, calling_domain)`
Tidying 2024-04-11 10:00:00 +00:00			`fitness_performance(getreq_start_time, fitness,`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`'_GET', '_hashtag_search_rss2',`
Tidying 2024-04-11 10:00:00 +00:00			`debug)`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00

			`def hashtag_search_json2(self, calling_domain: str,`
			`referer_domain: str,`
			`path: str, cookie: str,`
			`base_dir: str, http_prefix: str,`
			`domain: str, domain_full: str, port: int,`
			`onion_domain: str, i2p_domain: str,`
			`getreq_start_time,`
Tidying 2024-04-11 10:00:00 +00:00			`max_posts_in_feed: int,`
			`fitness: {}, debug: bool) -> None:`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`"""Return a json collection for a hashtag`
			`"""`
			`page_number = 1`
			`if '?page=' in path:`
			`page_number_str = path.split('?page=')[1]`
			`if page_number_str.isdigit():`
			`page_number = int(page_number_str)`
			`path = path.split('?page=')[0]`
			`hashtag = path.split('/tags/')[1]`
			`if is_blocked_hashtag(base_dir, hashtag):`
			`http_400(self)`
			`return`
			`nickname = None`
			`if '/users/' in path:`
			`actor = \`
			`http_prefix + '://' + domain_full + path`
			`nickname = \`
			`get_nickname_from_actor(actor)`
			`hashtag_json = \`
			`hashtag_search_json(nickname,`
			`domain, port,`
			`base_dir, hashtag,`
			`page_number, max_posts_in_feed,`
			`http_prefix)`
			`if hashtag_json:`
			`msg_str = json.dumps(hashtag_json)`
			`msg_str = convert_domains(calling_domain, referer_domain,`
			`msg_str, http_prefix, domain,`
			`onion_domain, i2p_domain)`
			`msg = msg_str.encode('utf-8')`
			`msglen = len(msg)`
			`set_headers(self, 'application/json', msglen,`
			`None, calling_domain, True)`
			`write2(self, msg)`
			`else:`
			`origin_path_str = path.split('/tags/')[0]`
			`origin_path_str_absolute = \`
			`http_prefix + '://' + domain_full + origin_path_str`
			`if calling_domain.endswith('.onion') and onion_domain:`
			`origin_path_str_absolute = \`
			`'http://' + onion_domain + origin_path_str`
			`elif (calling_domain.endswith('.i2p') and onion_domain):`
			`origin_path_str_absolute = \`
			`'http://' + i2p_domain + origin_path_str`
			`redirect_headers(self, origin_path_str_absolute,`
			`cookie, calling_domain)`
Tidying 2024-04-11 10:00:00 +00:00			`fitness_performance(getreq_start_time, fitness,`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`'_GET', '_hashtag_search_json',`
Tidying 2024-04-11 10:00:00 +00:00			`debug)`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00

			`def hashtag_search2(self, calling_domain: str,`
			`path: str, cookie: str,`
			`base_dir: str, http_prefix: str,`
			`domain: str, domain_full: str, port: int,`
			`onion_domain: str, i2p_domain: str,`
			`getreq_start_time,`
			`curr_session,`
Tidying 2024-04-11 10:00:00 +00:00			`max_posts_in_hashtag_feed: int,`
			`translate: {}, account_timezone: {},`
			`bold_reading_nicknames: {},`
			`fitness: {}, debug: bool,`
			`recent_posts_cache: {},`
			`max_recent_posts: int,`
			`cached_webfingers: {},`
			`person_cache: {},`
			`project_version: str,`
			`yt_replace_domain: str,`
			`twitter_replacement_domain: str,`
			`show_published_date_only: bool,`
			`peertube_instances: [],`
			`allow_local_network_access: bool,`
			`theme_name: str,`
			`system_language: str,`
			`max_like_count: int,`
			`signing_priv_key_pem: str,`
			`cw_lists: {},`
			`lists_enabled: {},`
			`dogwhistles: {},`
			`map_format: str,`
			`access_keys: {},`
			`min_images_for_accounts: [],`
			`buy_sites: [],`
			`auto_cw_cache: {}) -> None:`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`"""Return the result of a hashtag search`
			`"""`
			`page_number = 1`
			`if '?page=' in path:`
			`page_number_str = path.split('?page=')[1]`
			`if '#' in page_number_str:`
			`page_number_str = page_number_str.split('#')[0]`
			`if len(page_number_str) > 5:`
			`page_number_str = "1"`
			`if page_number_str.isdigit():`
			`page_number = int(page_number_str)`
			`hashtag = path.split('/tags/')[1]`
			`if '?page=' in hashtag:`
			`hashtag = hashtag.split('?page=')[0]`
			`hashtag = urllib.parse.unquote_plus(hashtag)`
			`if is_blocked_hashtag(base_dir, hashtag):`
			`print('BLOCK: blocked hashtag #' + hashtag)`
			`msg = html_hashtag_blocked(base_dir,`
Tidying 2024-04-11 10:00:00 +00:00			`translate).encode('utf-8')`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`msglen = len(msg)`
			`login_headers(self, 'text/html', msglen, calling_domain)`
			`write2(self, msg)`
			`return`
			`nickname = None`
			`if '/users/' in path:`
			`nickname = path.split('/users/')[1]`
			`if '/' in nickname:`
			`nickname = nickname.split('/')[0]`
			`if '?' in nickname:`
			`nickname = nickname.split('?')[0]`
			`timezone = None`
Tidying 2024-04-11 10:00:00 +00:00			`if account_timezone.get(nickname):`
			`timezone = account_timezone.get(nickname)`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`bold_reading = False`
Tidying 2024-04-11 10:00:00 +00:00			`if bold_reading_nicknames.get(nickname):`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`bold_reading = True`
			`hashtag_str = \`
			`html_hashtag_search(nickname, domain, port,`
Tidying 2024-04-11 10:00:00 +00:00			`recent_posts_cache,`
			`max_recent_posts,`
			`translate,`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`base_dir, hashtag, page_number,`
			`max_posts_in_hashtag_feed,`
			`curr_session,`
Tidying 2024-04-11 10:00:00 +00:00			`cached_webfingers,`
			`person_cache,`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`http_prefix,`
Tidying 2024-04-11 10:00:00 +00:00			`project_version,`
			`yt_replace_domain,`
			`twitter_replacement_domain,`
			`show_published_date_only,`
			`peertube_instances,`
			`allow_local_network_access,`
			`theme_name,`
			`system_language,`
			`max_like_count,`
			`signing_priv_key_pem,`
			`cw_lists,`
			`lists_enabled,`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`timezone, bold_reading,`
Tidying 2024-04-11 10:00:00 +00:00			`dogwhistles,`
			`map_format,`
			`access_keys,`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`'search',`
Tidying 2024-04-11 10:00:00 +00:00			`min_images_for_accounts,`
			`buy_sites,`
			`auto_cw_cache)`
daemon hashtag functions in their own module 2024-03-02 17:06:58 +00:00			`if hashtag_str:`
			`msg = hashtag_str.encode('utf-8')`
			`msglen = len(msg)`
			`set_headers(self, 'text/html', msglen,`
			`cookie, calling_domain, False)`
			`write2(self, msg)`
			`else:`
			`origin_path_str = path.split('/tags/')[0]`
			`origin_path_str_absolute = \`
			`http_prefix + '://' + domain_full + origin_path_str`
			`if calling_domain.endswith('.onion') and onion_domain:`
			`origin_path_str_absolute = \`
			`'http://' + onion_domain + origin_path_str`
			`elif (calling_domain.endswith('.i2p') and onion_domain):`
			`origin_path_str_absolute = \`
			`'http://' + i2p_domain + origin_path_str`
			`redirect_headers(self, origin_path_str_absolute + '/search',`
			`cookie, calling_domain)`
Tidying 2024-04-11 10:00:00 +00:00			`fitness_performance(getreq_start_time, fitness,`
			`'_GET', '_hashtag_search', debug)`
Move hashtag function 2024-03-02 17:24:29 +00:00

			`def get_hashtag_categories_feed2(self, calling_domain: str, path: str,`
			`base_dir: str, proxy_type: str,`
			`getreq_start_time,`
			`debug: bool,`
			`curr_session) -> None:`
			`"""Returns the hashtag categories feed`
			`"""`
			`curr_session = \`
			`establish_session("get_hashtag_categories_feed",`
			`curr_session, proxy_type,`
			`self.server)`
			`if not curr_session:`
			`http_404(self, 27)`
			`return`

			`hashtag_categories = None`
			`msg = \`
			`get_hashtag_categories_feed(base_dir, hashtag_categories)`
			`if msg:`
			`msg = msg.encode('utf-8')`
			`msglen = len(msg)`
			`set_headers(self, 'text/xml', msglen,`
			`None, calling_domain, True)`
			`write2(self, msg)`
			`if debug:`
			`print('Sent rss2 categories feed: ' +`
			`path + ' ' + calling_domain)`
			`fitness_performance(getreq_start_time, self.server.fitness,`
			`'_GET', '_get_hashtag_categories_feed', debug)`
			`return`
			`if debug:`
			`print('Failed to get rss2 categories feed: ' +`
			`path + ' ' + calling_domain)`
			`http_404(self, 28)`