Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[meme] logos der interaction sites #11

Open
martin-raden opened this issue Nov 29, 2023 · 1 comment
Open

[meme] logos der interaction sites #11

martin-raden opened this issue Nov 29, 2023 · 1 comment
Assignees

Comments

@martin-raden
Copy link
Collaborator

Hi @MatthiasHerrmann

hier mal die Punkte zum meme-logo bau

  • wir extrahieren aus allen sequenzen, in denen wir einen CM Hit haben
    • im 5' UTR : -30 bis +10 bzgl. CDS anfang
    • im 5' CDS : +20 bis +60
    • im 3' UTR : -25 bis +5 bzgl. CM hit anfang (allerdings vom langen CM... für die kurzen CMs müsste man das entsprechend verschieben)
    • im 3' UTR : +5 bis +35 bzgl. CM hist start

ggf. kannst du für die sequenzen erstmal einen phylogenetischen baum rechnen, um zu sehen, ob du wilde outlier dabei hast. dazu gibts zB ein tool vom clustalw package, aber weiss nicht, wie robust/nett das ist. ist nur erstmal eine idee. ggf. einfach alle reinstopfen und dann im meme output nochmal überlegen, ob man das brauchen kann.

  • du könntest die virus class in den FASTA header jeder sequenz inkludieren, ala >MBFV-NC_..., dann kann man die ggf. einfacher "sortieren" bzw. einordnen, wenn man den phylogenetischen baum oder die meme daten anschaut.

  • in meme ggf ausschalten, dass er auf dem komplementären strang sucht. das wär quatsch

  • grundlegend erwarten/suchen wir EIN motiv pro subsequenz, aber ggf. schiessen uns da (gerade im 3' UTR) konservierte strukturmotive dazwischen, sodass du da ggf. noch mehr zulassen/suchen musst, um auch ein motiv inder zielregion zu finden

  • motivlänge 10-15 nt

  • .. ?

Die Grenzen der subsequenzen sind jetzt erstmal ziemlich ad hoc. Kann man auch gern noch anpassen, wenn man bedarf sieht.

Grüße,
Martin

@martin-raden
Copy link
Collaborator Author

hab nochmal über die sequenzmotive nachgedacht.

es wäre gut (und wichtig) die positionierung der motive (on average) zu wissen (zB bzgl CDS oder CM start), um entscheiden zu können, ob das motiv in der interaktionsstelle liegt und wenn ja wo.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants