• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

AMD instinct mi25 lässt sich nicht betreiben

Hi zusammen,
Ich habe einen Asus esc4000/fdr g2 mit 2 Radeon instinct mi25, für die es auf der AMD-Treiber-Seite nur Linuxtreiber gibt. Egal welches Linux ich zu installieren versuche, es wird immer ein Fehler in Schleife ausgegeben. Manche distries kommen da durch und installieren sich fertig, andere (zB hiveos) schaffen das nicht. Mutmaßliche Ursache könnte das Kernel Modul ' amdgpu' sein, oder damit im Zusammenhang stehen. Bin grad auf Arbeit, heute Abend mehr Details..
 
Zuletzt bearbeitet:

josef-wien

Ultimate Guru
amdgpu ist im Kernel enthalten, und wenn er nicht korrekt funktioniert (was z. B. durch einen zu alten Kernel möglich wäre), brauchst Du Dich um dessen Erweiterung amdgpu-pro von AMD nicht zu kümmern.

Was ergibt:
Code:
inxi -GSxxx
 
OP
H

Hinkelbrain

Newbie
wo fügt man dieses nomodeset denn ein? und wo dieses inxi -GSxxx ???
nabend erst ma :)

nett, daß hier trotz spärlicher Informationslage schon hilfeposts eintrafen, ich führ trotzdem mal etwas detailierter aus.

n paar umgebungsbeschreibungen:

nachdem grub2 das OS (debian11.6) zu laden beginnt, sammelt der Monitor den mutmaßlichen fehler
amdgpu: trn=2 ACK schould not assert! wait again!
im dauerfeuermodus bis etwa 180.124356 oder 300.124356 bzw bis sich der desktop zeigt. man kann jedoch mit dmesg -k im terminal weiter diesen fehler beobachten (wenn es denn ein fehler ist?)

das mainboard z9pg-d16 von asus hat eine onboardgrafik die sich als ast1300/2300 als erstes sichtb
ares zeichen beim starten der hardware auf dem bildschirm meldet. diese grafikkarte (16 megabyte ddr2-ram) ist im bios priorisiert und der desktop läuft auch darauf. das board ist mit 4 stück je 8GB großen ramriegeln bestückt. unigine valley bringt zw 1.1 und 1.6 fps bei 640x380 pixeln im fenstermodus und man gewinnt den eindruck, daß die cpu´s das alles rechnen (

es hat 2 cpu-sockel die mit je einem e5-2670 der ersten generation bestückt sind.

jede cpu scheint ihre eigenen pcie-slots zu kontrollieren, jede cpu 4 stück mit entweder 2 mal x16 oder 4 mal x8 pcie3.0

die eine mi25 steckt links, die andere rechts, somit wird jede über quasi ihre eigene cpu angebunden.

beide mi 25 werden in lspci -vnnk mit je drei einträgen dargestellt.
2 davon sind pcie-bridges [0604] mit kerneldriver in use: pcieport
und einer ist ein vga-compatibler-controller [0300] dem das kernemodul amdgpu zueigen scheint. (die onboardgrafik ist ähnlich definiert, nur mit anderem modul und treiber)


bei einem der beschleuniger ist zum kernelmodul amdgpu noch der kerneldriver in use: amdgpu angezeigt, während bei dem anderen, wo das nicht so ist, auch speicherbereiche als disabled markiert sind.

**************************************************************************
ob wohl dieser amdgpu-kerneldriver-in-use diesen fehler generiert???
**************************************************************************

diese von lspci -vnnk gelieferten daten bekomme/bekam ich identisch unter dem aktuell noch lauffähigen debian 11.6 (mit kernel 5.10, ist das schon alt oder noch neu??) wie auch unter suse leap 15.4 oder tumbleweed .

weiters hatte ich das aktuelle hiveos, proxmox mint und irgendein ubuntu versucht zu installieren. mint funktionierte nicht richtig (zeitlupendesktop) .centos hab ich nicht installiert bekommen, weil es keinen autoinstaller mitbrachte und proxmox hab ich wieder gekillt, weil ich zu doof war, darin irgendwas ergonomisches zu finden, das mich durch wildes rumgeklicke weiter gebracht hätte, da hätte ich wohl viel dokumentation lesen müssen...


...unter dem aktuellen debian habe ich ein paar anwendungen installieren können, die mit hardwareunterstützung rendern könnten, aber die finden kein kompatibles gerät oder fragen erst garnicht. unter anderem waren das kdenlive blender und mandelbulber v2.

letzterer zeigte am besten, was es heißt, wenn nur cpu´s da sind, die kerne gingen alle auf maximum im systemmonitor, was die anderen anwendungen eher nicht so machten, die waren verhaltener beim resourcen-grabschen.

auch hab ich gl-117 und 0 A.D. (2 freie spiele) starten können und die liefen flüssig , aber unterm strich kann ich eigentlich überhaupt nicht erkennen, ob diese beschleuniger zu irgendeinem zeitpunkt denn überhaupt was rechnen durften.

somit zu meinem primären anliegen
 
OP
H

Hinkelbrain

Newbie
wie erkenne ich unter linux, welche hardware was macht? in live am besten? ....da lob ich mal den resourcenmonitor von win10, der dürfte aber in linux unter wine vmtl keine schnittstellen finden. (mir gehts da nur um die gpu-benutzung von den beiden beschleunigern)

gibt es denn sowas nicht auch für linux??? also gpu usage oder gfx-speicherauslastung neben den cpu´s. und überhaupt, wo ist die hardwareverwaltung bei llinux?? im gerätemanager bei windoof kann man treiber kicken und geräte abschalten (super bei unerwünschtem onboardkram zB oder eben auch in meinem fall hier)
wie geht das denn bei linux? .....oder kann ich evtl eine anwendung irgendwie dazu zwingen, amdgpu zu benutzen??

kann mir da jemand weiter helfen???

....ich schaffe es noch nicht mal, diese bescheuerte monitorsperre zu deaktivieren.... (ich glaub bei leap ging das irgendwo, da hatte ich aber auch xfce, jetzt hab ich wohl gnome)



aja, vielleicht hätte ich am anfang erwähnen sollen, daß ich keine ahnung davon hab, wie linux funktioniert, ich hab die letzten 30 jahre nur windosen benutzt und mit linux muss ich mich quasi nur wegen dieser beschleuniger beschäftigen. klar macht linux beim rumprobieren auch neugierig, aber in erster linie gehts mir tatsächlich darum, rauszufinden, ob die acceleratoren funktionieren und für die gibt es von amd keine windowstreiber, darum dachte ich als erstes an hiveos, da wären die in ihrer bestimmungsgemäßen umgebung sicher am leichtesten in betrieb zu setzten, dachte ich.....

bisher lese ich im netz rum und probiere irgendwelche commandozeilen im terminal aus, aber wie man zB ein repository erkennt, das nicht eingespeichert ist sondern irgendwo im inet sich befinden müsste, krieg ich auch nicht hin .

was ich zB hier
AMDGPU PRO - ArchWiki
gefunden habe, wirkt auf mich wie eine hilfreiche annäherung, aber mein verständnis dieser ausdrucksweise reicht da nicht weit genug, ich verteh diese syntax nicht...

gibts für linux einen funktions-schaltplan oder sowas? so wie man das von neuen chiparchitekturen in onlinemagazinen kennt?
 

susejunky

Moderator
Teammitglied
Hallo @Hinkelbrain ,

herzlich willkommen im Linux Club Forum.

... Ich habe einen Asus esc4000/fdr g2 mit 2 Radeon instinct mi25 ...
Da ich noch nie mit dieser Art von Hardware gearbeitet habe, kann ich Dir leider nicht weiterhelfen und ich kann Dir auch nicht sagen, ob es im Forum Mitglieder gibt, die Dich unterstützen können.

Aber hier ein paar allgemeine Hinweise, wie Du Deine Chancen auf Unterstützung deutlich verbessern kannst:

Korrekte Rechtschreibung, ordentlicher Satzbau und ein gut formatierter Beitrag machen es potentiellen Unterstützern einfacher Dein Problem zu verstehen. Hier findest Du Hinweise, wie Du Deine Beiträge formatieren kannst. Bei der korrekte Rechtschreibung kann Dich die Rechtschreibprüfung Deines Browsers unterstützen.

... es wird immer ein Fehler in Schleife ausgegeben ...
Bitte zeige stets konkrete Daten wie z.B. Auszüge aus Log-Dateien oder auch Bildschirmfotos.

Mutmaßliche Ursache könnte das Kernel Modul ' amdgpu' sein
Bitte beschreibe, was konkret Dich zu dieser Vermutung veranlasst (z.B. Fehlermeldungen, Ergebnisse bestimmter Befehle, ...).

... beide mi 25 werden in lspci -vnnk mit je drei einträgen dargestellt.
Wenn Du Befehle in einem Terminals ausführst und dann das Ergebnis hier zeigen willst, dann kopiere bitte die von Dir verwendete Befehlszeile, alle vom Befehl ausgegebenen Information und die darauf folgende, leere Befehlsaufforderung und füge das Ganze in Deinen Beitrag als "Code" (im Forumeditor die Schaltfläche "</>") ein:
Code:
> lspci
00:00.0 Host bridge: Intel Corporation 4th Gen Core Processor DRAM Controller (rev 06)
00:02.0 VGA compatible controller: Intel Corporation Xeon E3-1200 v3/4th Gen Core Processor Integrated Graphics Controller (rev 06)
00:03.0 Audio device: Intel Corporation Xeon E3-1200 v3/4th Gen Core Processor HD Audio Controller (rev 06)
00:14.0 USB controller: Intel Corporation 9 Series Chipset Family USB xHCI Controller
00:16.0 Communication controller: Intel Corporation 9 Series Chipset Family ME Interface #1
00:1a.0 USB controller: Intel Corporation 9 Series Chipset Family USB EHCI Controller #2
00:1b.0 Audio device: Intel Corporation 9 Series Chipset Family HD Audio Controller
00:1c.0 PCI bridge: Intel Corporation 9 Series Chipset Family PCI Express Root Port 1 (rev d0)
00:1c.2 PCI bridge: Intel Corporation 9 Series Chipset Family PCI Express Root Port 3 (rev d0)
00:1c.3 PCI bridge: Intel Corporation 82801 PCI Bridge (rev d0)
00:1c.7 PCI bridge: Intel Corporation 9 Series Chipset Family PCI Express Root Port 8 (rev d0)
00:1d.0 USB controller: Intel Corporation 9 Series Chipset Family USB EHCI Controller #1
00:1f.0 ISA bridge: Intel Corporation Z97 Chipset LPC Controller
00:1f.2 SATA controller: Intel Corporation 9 Series Chipset Family SATA Controller [AHCI Mode]
00:1f.3 SMBus: Intel Corporation 9 Series Chipset Family SMBus Controller
02:00.0 Ethernet controller: Qualcomm Atheros Killer E220x Gigabit Ethernet Controller (rev 13)
03:00.0 PCI bridge: ASMedia Technology Inc. ASM1083/1085 PCIe to PCI Bridge (rev 03)
>

Ich wünsche Dir viel Erfolg.

Viele Grüße

susejunky
 

josef-wien

Ultimate Guru
wo dieses inxi -GSxxx
In einem Konsolfenster/Terminalfenster.

Beim Überfliegen Deiner aneinandergefügten Kleinbuchstaben-Worte meint man einmal, daß bei vielen Distributionen nichts (ordentlich) funktioniert, und dann wieder, daß ohnehin alles klappt. Was ist jetzt wirklich Dein Problem und bei welcher Distribution taucht es auf?
 
OP
H

Hinkelbrain

Newbie
ha, hi josef-wien, gerne fass ich nochma kurz zusammen.

ich schrieb:
beide mi 25 werden in lspci -vnnk mit je drei einträgen dargestellt.
2 davon sind pcie-bridges [0604] mit kerneldriver in use: pcieport
und einer ist ein vga-compatibler-controller [0300] dem das kernemodul amdgpu zueigen scheint. (die onboardgrafik ist ähnlich definiert, nur mit anderem modul und treiber)

scheinbare endlosmeldung ab dem ersten booten einer frisch installierten distribution, zB debian 5.10 -21 mit dem ungefähren inhalt:

[amdgpu] trn=2 ACK should not assert! wait again! und ner art laufender nummer vorneweg.

(falls die installation dann bis zu einem desktop durchdringt bzw einen desktop aufmacht, sieht man diese fehlermeldung nicht mehr. suse leap 15.4 und tumbleweed und hiveos und mint und ubuntu und proxmox machen das auch so, also diesen fehler endlos ausgeben. irgendwie hört die ausgabe dieses fehlers aber meistens irgendwann auf. oft schaffen es die installationen dann irgendwann, fertig gebootet zu haben oder so....)

in einem irc-chat brachte mir jemand den befehl dmesg -k bei (wenn man das so sagen kann) , der dann über ein irgendwo auf diesem desktop geöffnetes terminal diese (fehler?)meldung wieder anzeigt.

dieses verhalten wirkt auf mich wie ein fehler im system von linux bzw diesem amdgpu modul.

leider leider konnte ich bisher nirgends im netz einen für mich einfach umzusetzenden hinweis auf einen weg finden, über den ich die nutzung dieser 2 karten irgendwie einsehen kann, während sie mutmaßlich in benutzung sein könnten.

das ist mein eigentliches problem (abgesehen davon, das ich mich mit linux prinzipiell garnicht bis sehr überhaupt nicht auskenne :-/ ...)

das gestern noch bootfähige debian 11.6 bootet nach einem nächtlichen und vermutlich durch falsche konfiguration mißglückten versuch, das amdgpu modul zu deinstallieren, heute nämlich nicht mehr.

deswegen mache ich mich jetzt an eine neuinstallation. ich verwende wohl nochmal debian 11.6 und versuche mit einer möglichst kleinen installation das gleiche nochmal.

auch schaue ich mal, ob ich unmodeset irgendwo beim installieren unterbringen kann.


....kann es sein, daß es besser wäre, wenn man als linux-benutzer wenigstens rudimentär , besser durchschnittliche bis gute programmierkenntnisse besitzt?????
 
OP
H

Hinkelbrain

Newbie
soderle, hier mal ein auszug aus den ersten zwei terminalbefehlen nach der installation (die mißglückterweise sehr groß anstatt sehr klein wurde) und dem ersten hochbooten, als ein kleiner einblick in das system. gäbe es noch etwas wichtiges zu wissen, bevor ich morgen versuchen werde, amdgpu zu deinstallieren?

ich habe beim installieren `automatisch mit grafik` angeklickt und da kann man bis auf die desktops im späteren installationsverlauf nix auswählen oder nomodeset irgendwo zwischen würgen und es dann eben laufen lassen.


Code:
root@debian:/home/tom# lspci -vnnk




02:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Vega 10 PCIe Bridge [1022:1470] (rev 01) (prog-if 00 [Normal decode])
    Flags: bus master, fast devsel, latency 0, IRQ 26, NUMA node 0, IOMMU group 24
    Memory at cf500000 (32-bit, non-prefetchable) [size=16K]
    Bus: primary=02, secondary=03, subordinate=05, sec-latency=0
    I/O behind bridge: [disabled]
    Memory behind bridge: cea00000-cf4fffff [size=11M]
    Prefetchable memory behind bridge: 000003bef0000000-000003bff1ffffff [size=4128M]
    Capabilities: [48] Vendor Specific Information: Len=08 <?>
    Capabilities: [50] Power Management version 3
    Capabilities: [58] Express Upstream Port, MSI 00
    Capabilities: [a0] MSI: Enable- Count=1/1 Maskable- 64bit+
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] Secondary PCI Express
    Capabilities: [320] Latency Tolerance Reporting
    Capabilities: [370] L1 PM Substates
    Kernel driver in use: pcieport

03:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Vega 10 PCIe Bridge [1022:1471] (prog-if 00 [Normal decode])
    Flags: bus master, fast devsel, latency 0, IRQ 34, NUMA node 0, IOMMU group 25
    Bus: primary=03, secondary=04, subordinate=05, sec-latency=0
    I/O behind bridge: [disabled]
    Memory behind bridge: cea00000-cf4fffff [size=11M]
    Prefetchable memory behind bridge: 000003bef0000000-000003bff1ffffff [size=4128M]
    Capabilities: [50] Power Management version 3
    Capabilities: [58] Express Downstream Port (Slot-), MSI 00
    Capabilities: [a0] MSI: Enable+ Count=1/1 Maskable- 64bit+
    Capabilities: [c0] Subsystem: Advanced Micro Devices, Inc. [AMD] Vega 10 PCIe Bridge [1022:1471]
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] Secondary PCI Express
    Capabilities: [2a0] Access Control Services
    Kernel driver in use: pcieport

04:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 [Radeon Instinct MI25] [1002:6860] (rev 01) (prog-if 00 [VGA controller])
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Radeon PRO V320 [1002:0c35]
    Flags: fast devsel, IRQ 26, NUMA node 0, IOMMU group 26
    Memory at <unassigned> (64-bit, prefetchable)
    Memory at cea00000 (64-bit, prefetchable) [size=2M]
    Memory at cf400000 (32-bit, non-prefetchable) [size=512K]
    Expansion ROM at cf480000 [disabled] [size=128K]
    Capabilities: [48] Vendor Specific Information: Len=08 <?>
    Capabilities: [50] Power Management version 3
    Capabilities: [64] Express Legacy Endpoint, MSI 00
    Capabilities: [a0] MSI: Enable- Count=1/4 Maskable+ 64bit+
    Capabilities: [c0] MSI-X: Enable- Count=3 Masked-
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] Secondary PCI Express
    Capabilities: [2a0] Access Control Services
    Capabilities: [2b0] Address Translation Service (ATS)
    Capabilities: [2c0] Page Request Interface (PRI)
    Capabilities: [2d0] Process Address Space ID (PASID)
    Capabilities: [320] Latency Tolerance Reporting
    Capabilities: [328] Alternative Routing-ID Interpretation (ARI)
    Capabilities: [330] Single Root I/O Virtualization (SR-IOV)
    Capabilities: [400] Vendor Specific Information: ID=0002 Rev=2 Len=0f0 <?>
    Kernel driver in use: amdgpu
    Kernel modules: amdgpu



0a:00.0 PCI bridge [0604]: ASPEED Technology, Inc. AST1150 PCI-to-PCI Bridge [1a03:1150] (rev 02) (prog-if 00 [Normal decode])
    Flags: bus master, fast devsel, latency 0, IRQ 19, NUMA node 0, IOMMU group 29
    Bus: primary=0a, secondary=0b, subordinate=0b, sec-latency=32
    I/O behind bridge: 00006000-00006fff [size=4K]
    Memory behind bridge: cd000000-ce0fffff [size=17M]
    Prefetchable memory behind bridge: [disabled]
    Capabilities: [50] MSI: Enable- Count=1/1 Maskable- 64bit+
    Capabilities: [78] Power Management version 3
    Capabilities: [80] Express PCI-Express to PCI/PCI-X Bridge, MSI 00
    Capabilities: [a4] Subsystem: ASPEED Technology, Inc. AST1150 PCI-to-PCI Bridge [1a03:1150]
    Capabilities: [100] Virtual Channel

0b:00.0 VGA compatible controller [0300]: ASPEED Technology, Inc. ASPEED Graphics Family [1a03:2000] (rev 21) (prog-if 00 [VGA controller])
    Subsystem: ASUSTeK Computer Inc. ASPEED Graphics Family [1043:84eb]
    Flags: medium devsel, IRQ 19, NUMA node 0, IOMMU group 29
    Memory at cd000000 (32-bit, non-prefetchable) [size=16M]
    Memory at ce000000 (32-bit, non-prefetchable) [size=128K]
    I/O ports at 6000 [size=128]
    Expansion ROM at 000c0000 [virtual] [disabled] [size=128K]
    Capabilities: [40] Power Management version 3
    Kernel driver in use: ast
    Kernel modules: ast



84:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Vega 10 PCIe Bridge [1022:1470] (rev 01) (prog-if 00 [Normal decode])
    Flags: bus master, fast devsel, latency 0, IRQ 41, NUMA node 1, IOMMU group 74
    Memory at fba00000 (32-bit, non-prefetchable) [size=16K]
    Bus: primary=84, secondary=85, subordinate=87, sec-latency=0
    I/O behind bridge: [disabled]
    Memory behind bridge: fb100000-fb9fffff [size=9M]
    Prefetchable memory behind bridge: 000003f800000000-000003fd021fffff [size=20514M]
    Capabilities: [48] Vendor Specific Information: Len=08 <?>
    Capabilities: [50] Power Management version 3
    Capabilities: [58] Express Upstream Port, MSI 00
    Capabilities: [a0] MSI: Enable- Count=1/1 Maskable- 64bit+
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] Secondary PCI Express
    Capabilities: [320] Latency Tolerance Reporting
    Capabilities: [370] L1 PM Substates
    Kernel driver in use: pcieport

85:00.0 PCI bridge [0604]: Advanced Micro Devices, Inc. [AMD] Vega 10 PCIe Bridge [1022:1471] (prog-if 00 [Normal decode])
    Flags: bus master, fast devsel, latency 0, IRQ 43, NUMA node 1, IOMMU group 75
    Bus: primary=85, secondary=86, subordinate=87, sec-latency=0
    I/O behind bridge: [disabled]
    Memory behind bridge: fb100000-fb9fffff [size=9M]
    Prefetchable memory behind bridge: 000003f800000000-000003fd021fffff [size=20514M]
    Capabilities: [50] Power Management version 3
    Capabilities: [58] Express Downstream Port (Slot-), MSI 00
    Capabilities: [a0] MSI: Enable+ Count=1/1 Maskable- 64bit+
    Capabilities: [c0] Subsystem: Advanced Micro Devices, Inc. [AMD] Vega 10 PCIe Bridge [1022:1471]
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] Secondary PCI Express
    Capabilities: [2a0] Access Control Services
    Kernel driver in use: pcieport

86:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] Vega 10 [Radeon Instinct MI25] [1002:6860] (rev 01) (prog-if 00 [VGA controller])
    Subsystem: Advanced Micro Devices, Inc. [AMD/ATI] Radeon PRO V320 [1002:0c35]
    Flags: fast devsel, IRQ 11, NUMA node 1, IOMMU group 76
    Memory at 3f800000000 (64-bit, prefetchable) [disabled] [size=16G]
    Memory at 3fd02000000 (64-bit, prefetchable) [disabled] [size=2M]
    Memory at fb900000 (32-bit, non-prefetchable) [disabled] [size=512K]
    Expansion ROM at fb980000 [disabled] [size=128K]
    Capabilities: [48] Vendor Specific Information: Len=08 <?>
    Capabilities: [50] Power Management version 3
    Capabilities: [64] Express Legacy Endpoint, MSI 00
    Capabilities: [a0] MSI: Enable- Count=1/4 Maskable+ 64bit+
    Capabilities: [c0] MSI-X: Enable- Count=3 Masked-
    Capabilities: [100] Vendor Specific Information: ID=0001 Rev=1 Len=010 <?>
    Capabilities: [150] Advanced Error Reporting
    Capabilities: [270] Secondary PCI Express
    Capabilities: [2a0] Access Control Services
    Capabilities: [2b0] Address Translation Service (ATS)
    Capabilities: [2c0] Page Request Interface (PRI)
    Capabilities: [2d0] Process Address Space ID (PASID)
    Capabilities: [320] Latency Tolerance Reporting
    Capabilities: [328] Alternative Routing-ID Interpretation (ARI)
    Capabilities: [330] Single Root I/O Virtualization (SR-IOV)
    Capabilities: [400] Vendor Specific Information: ID=0002 Rev=2 Len=0f0 <?>
    Kernel modules: amdgpu

ff:08.0 System peripheral [0880]: Intel Corporation Xeon E5/Core i7 QPI Link 0 [8086:3c80] (rev 07)
    Subsystem: ASUSTeK Computer Inc. Xeon E5/Core i7 QPI Link 0 [1043:84f0]
    Flags: fast devsel, NUMA node 1, IOMMU group 77


root@debian:/home/tom# dmesg -k
[ 1098.998678] amdgpu: trn=2 ACK should not assert! wait again !
[ 1099.014685] amdgpu: trn=2 ACK should not assert! wait again !
[ 1099.030686] amdgpu: trn=2 ACK should not assert! wait again !
[ 1099.046681] amdgpu: trn=2 ACK should not assert! wait again !
[ 1099.062683] amdusw...

und vielleicht noch dieser link hier, der zeigt, daß diese karten von 2017 bis 2020/21 ihre primäre Nutzung am Markt gehabt haben dürften, unter windows mit hwinfo und unter gpu-z zeigt sich HPE als subvendor und im vgabios der karte
https://en.wikipedia.org/wiki/List_of_AMD_graphics_processing_units#Radeon_Instinct_series
 
Zuletzt bearbeitet:

Sauerland

Ultimate Guru
Evtl im ersten Installationsbildschirm Taste e drücken?

Bei openSUSE funktioniert das
Wenn secure boot eingeschaltet ist mit Taste e und nomodeset an der richtigen Stelle
bei Legacy boot sogar per F-Tasten.
 

josef-wien

Ultimate Guru
bevor ich morgen versuchen werde, amdgpu zu deinstallieren
Ein Kernel-Modul kann man nicht einfach deinstallieren. Du müßtest einen eigenen Kernel bauen. Das wäre aber ebenso kontraproduktiv wie ein blacklist-Eintrag im Verzeichnis /etc/modprobe.d, denn der dann verwendete einfache Treiber reicht gerade aus, "behelfmäßige" Funktionen zur Verfügung zu stellen. Falls nomodeset etwas bewirkt, wirst Du mit der Leistungsfähigkeit auch keine Freude haben.

Laut lspci ist amdgpu nur für die erste Grafikkarte in Verwendung. Die Fehlermeldung interpretiere ich so, daß amdgpu auf die zweite Karte wartet, aber die meldet sich nicht. Falls der PC UEFI hat, Du aber im BIOS-Modus/Legacy-Modus/CSM installierst und startest, könnte eine Neuinstallation im UEFI-Modus helfen. Was sonst zu unternehmen wäre, damit amdgpu für beide Karten verwendet wird, kann ich nicht sagen, aber hier mußt Du meiner Meinung nach ansetzen. Bei den Parametern (modinfo amdgpu | grep parm) entdecke ich als amdgpu-Laie nichts.
 
OP
H

Hinkelbrain

Newbie
hmm, das werde ich mir auf jeden fall mal für die nächste installation vormerken. dann nehme ich einfach wieder suseLEAP15.4 .....oooder ich versuch mal irgendwo ein suse mit neuerem kernel zu finden, mal schaun, noch läuft es ja ;-)

aktuell hatte ich heute beim 'zweiten' bootversuch ever der neuinstallation scheinbar einen freezer. die dauerhafte fehlerausgabe stopppte schon bei [ 87.xxxxxx] , was beim letzten auftreten dieses effektes dem rechner über mehrere stunden wartezeit keinen weiteren mucks abverlangte.

ich habe nun kurzerhand mal die acceleratoren ausgebaut und eine alte pcie v1 grafikkarte in einen der vorher benutzten slots gesteckt, wodurch am relativen ende der nun sehr vielfältigen ausgabe durch dmesg -k folgende zeile aufmerksamkeit von mir erheischte:

Code:
[   83.424366] radeon 0000:84:00.0: vgaarb: changed VGA decodes: olddecodes=io+mem,decodes=none:owns=none

in 84:00.0 steckte vorher einer der acceleratoren drin.

an dieser alten grafikkarte ist, anders als bei den acceleratoren, tatsächlich ein monitorausgang, der auch sofort eine erweiterung des desktops bietet.

für die komplette datei durchzusehen fehlt mir grad die zeit. ich finds jedoch extrem beeindruckend, wie souverän dieses linux hardware dann doch so einfach mal handhaben kann. wenn bei windows ein standarttreiber nicht funktioniert, dann kann man lange suchen und oft passen gefundene treiber dann nicht in meine vorstellung von stabilem betrieb...


...however, die Erkenntnis zum topic:

fehler wird durch das betriebsystem erzeugt - mi25-geräte werden zwar erkannt und eingebunden, können aber scheinbar nicht in benutzung gelangen (software die gpubeschleunigung anbietet, findet zB kein kompatibles gerät, so kdenlive..)
 
OP
H

Hinkelbrain

Newbie
@ josef-wien , das klingt spannend. vielleicht schaffe ich es noch vor der arbeit einen accelerator wieder einzubauen, dann müsste sich das doch auch irgendwie darstellen.

ich hab aber tatsächlich im bios csm aktiv und alle optionen auf legacy only, uefi brachte mich irgendwie durcheinander, und die festplatten irgendwie auch beim selecten der bootquelle.

danke jedenfalls für diesen hinweis, den ich nie im leben so aus den lspci-angaben interpretiert hätte :) . das probier ich auch mal aus.

Edit:
hier mal noch der vollständigkeit halber die daten dieser karte die jetzt einem der vormals von einer mi25 belegten pcie sockel steckt.

Code:
84:00.0 VGA compatible controller [0300]: Advanced Micro Devices, Inc. [AMD/ATI] RV370 [Radeon X300] [1002:5b60] (prog-if 00 [VGA controller])
    Subsystem: ASUSTeK Computer Inc. RV370 [Radeon X300] [1043:0083]
    Flags: bus master, fast devsel, latency 0, IRQ 48, NUMA node 1, IOMMU group 71
    Memory at f0000000 (32-bit, prefetchable) [size=128M]
    I/O ports at f000 [size=256]
    Memory at fb930000 (32-bit, non-prefetchable) [size=64K]
    Expansion ROM at fb900000 [disabled] [size=128K]
    Capabilities: [50] Power Management version 2
    Capabilities: [58] Express Endpoint, MSI 00
    Capabilities: [80] MSI: Enable+ Count=1/1 Maskable- 64bit+
    Capabilities: [100] Advanced Error Reporting
    Kernel driver in use: radeon
    Kernel modules: radeonfb, radeon

84:00.1 Display controller [0380]: Advanced Micro Devices, Inc. [AMD/ATI] RV370 [Radeon X300 SE] [1002:5b70]
    Subsystem: ASUSTeK Computer Inc. RV370 [Radeon X300 SE] [1043:0082]
    Flags: bus master, fast devsel, latency 0, NUMA node 1, IOMMU group 71
    Memory at fb920000 (32-bit, non-prefetchable) [size=64K]
    Capabilities: [50] Power Management version 2
    Capabilities: [58] Express Endpoint, MSI 00
 
Zuletzt bearbeitet:

josef-wien

Ultimate Guru
Zur "alten" Karte: Die gezeigte Meldung ist eine reine Information und kein Problem. Bei meiner Intel-Karte kommt sie allerdings schon nach 1,8 Sekunden. Vielleicht lohnt es sich, die umfangreichen Meldungen vom Kernel zu durchforsten, ob da nicht Probleme dokumentiert sind:
Code:
dmesg | grep -iE "erro|warn|crit|fail|fault"

P. S. Du solltest Dir eine Tastatur zulegen, die auch Großbuchstaben kann.
 
Oben